7月16日,首届“AI+光学”融合创新研讨会在西安召开。会议以“AI 赋能,光学引领”为主题,聚焦 AI 与光学交叉融合的关键领域,旨在推动我国“AI+光学”学科的创新发展,深化产学研合作,为相关领域的高质量发展注入新动能。
与会期间,由中国科学院西安光机所主办的我国首个 AI 与光学交叉融合领域英文期刊 iOptics《智能光学(英文)》正式创刊。中国电信集团 CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授受邀担任副主编,并发表创刊文章:Optical Image Processing and Applications Empowered by Vision-Language Models(大模型赋能光学图像智能处理)。

随着人工智能技术的快速发展,其与光学的融合将重构光学系统的设计范式与应用边界,并助力 AI 技术突破传统电子系统的算力与能效瓶颈。“AI+光学”还将为智能光电系统的创新提供理论基础,并推动包括涉水光学在内的多种技术和应用发展。
中国电信人工智能研究院(TeleAI)正在重点推进“智能光电”的理论研究与应用实践,并与 AI 治理、智传网(AI Flow)、智能体形成“一治+三智”的战略科研布局,目标打通并发展“AI 驱动的三大空间经济”,全面覆盖赛博空间、临地空间、广域空间。

随着人工智能技术的快速发展,其与光学的融合将重构光学系统的设计范式与应用边界,并助力 AI 技术突破传统电子系统的算力与能效瓶颈。“AI+光学”还将为智能光电系统的创新提供理论基础,并推动包括涉水光学在内的多种技术和应用发展。
中国电信人工智能研究院(TeleAI)正在重点推进“智能光电”的理论研究与应用实践,并与 AI 治理、智传网(AI Flow)、智能体形成“一治+三智”的战略科研布局,目标打通并发展“AI 驱动的三大空间经济”,全面覆盖赛博空间、临地空间、广域空间。

在 iOptics 的创刊文章中,李学龙教授带领团队系统梳理了从传统图像处理、深度学习到 VLMs 的技术演进,并深入分析了光学图像因高维结构、复杂模态等带来的建模挑战(如物理量建模难、数据稀缺等)。
此外,文章还介绍了 ViT、CLIP、LLaVA 等代表性 VLMs 的技术特点,并阐述其在医疗、遥感、工业等领域的应用(如 M3D 用于 3D 医学影像分析、EarthGPT 用于遥感图像理解)。最后,文章指出未来需在数据构建、模型优化、效率提升等方向继续突破。
可以预见,随着算法架构升级、高质量多模态数据集的系统构建、数据与知识融合以及跨模态推理能力的增强,新一代光学图像智能分析系统将具备自主决策、高频实时响应和多源融合理解的特性。
同时,伴随多模态统一建模范式的不断演化,光学图像理解正加速迈向多任务协同、跨模态推理与系统级集成的新阶段,成为通用人工智能在专业视觉领域的重要落地方向。这些进步将为科学研究、工业检测、医疗诊断等领域带来革命性的技术支撑,引领光学图像处理迈向更通用智能的未来。