星辰多模态大模型 TeleMM-2.0
又双叒叕上榜
还是“金、银、铜”全有的那种

前不久刚在 OpenCompass 多模态大模型榜单总榜排名 TOP2,最近 TeleMM-2.0 系列模型又获佳绩:在 OCRBench v2 中文榜单排名第一,英文榜单排名第二;在 MMLongBench-Doc 榜单获得第三名。
OCRBench v2 是用于评估大型多模态模型在视觉文本定位和推理方面能力的基准测试,覆盖 23 项任务、31 种场景、10000 条人工校验样本。TeleMM-2.0 在中文场景领先第二名 4 分,英文场景仅落后榜首 0.4 分,超过一众国际头部模型。


MMLongBench-Doc 是专注于评估长上下文文档理解能力的多模态基准测试,旨在衡量大型视觉语言模型在处理复杂、多页 PDF 文档时的表现。在该基准的 135 份长文档 PDF 评测中,TeleMM-2.0 在超长上下文理解、跨页推理、多模态融合等方面具有突出表现。

TeleMM-2.0 是中国电信人工智能研究院(TeleAI)与中电信人工智能科技有限公司打造的星辰多模态理解大模型。该模型由中国电信集团 CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授带领团队创新研发。
该模型之所以能在各项榜单取得优异成绩,得益于 TeleAI 构建的坚实数据引擎、强大训练框架,和精准的能力强化策略,并以智传网(AI Flow)理论为基础,实现了在文本/视觉 OCR 和多模态长文档理解任务中的卓越表现。
坚实的数据引擎
TeleMM-2.0 围绕文本定位、文档解析、细粒度文本识别及关键信息提取等核心任务,创新打造“自动合成+难例挖掘”双轮驱动的数据引擎,构建起一套大规模、高质量、覆盖全面的多模态文本理解数据体系,为模型训练提供坚实的数据支撑。
强大的训练框架
TeleAI 构建了“混合自然场景+文档图像”的多任务学习体系,深度融合不同场景下的任务特性,让模型在共享特征学习过程中充分挖掘跨场景数据价值。这不仅能有效提升模型的适配能力,更能强化特征提取的全面性与泛化能力,为后续专项任务处理筑牢基础。
精准的强化策略
针对空间定位、文档解析、关键信息提取等核心专项任务,TeleAI 开展针对性强化训练,通过“按需设计、精准强化”的模式,使模型在核心任务上的处理精度、效率与稳定性显著提升,更好地适配实际业务场景中的复杂需求。
应用落地
TeleMM-2.0 能够显著提升多模态文档解析效率与关键信息提取精度,实现业务场景的深度适配与快速落地,现已成功应用于星辰慧记等产品,并在政务、工业、交通等实际场景落地,为文档分析理解、空间推理等复杂任务提供高效可靠的解决方案。