近日,在 2025 世界电信和信息社会日大会开幕式上,中国通信学会(CIC)正式发布“2024 年度信息通信领域十大科技进展”。由中国电信人工智能研究院(TeleAI)自主研发的国内首个“全国产万亿参数大模型的软硬协同技术及应用”(万卡万参)成功入选。
此项成果由中国电信集团 CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授带领团队创新完成,填补了我国在超大参数规模模型训练领域的经验空白,标志着国产大模型训练正式进入全国产自主创新、安全可控的新阶段。

在“万卡万参”模型训练中,TeleAI 提出了协同训练机理与高效构建模式,并形成三项具有关键价值的创新技术。
第一,基于状态感知的集群动态管控与主动修复。使模型有效训练时长占比达到 98% 以上,单次模型训练时长超过 20 天。
第二,基于多维并行技术适配的国产框架优化。提出多流水交织技术和细粒度多副本并行策略;动态内存开销相比传统流水线方式降低了 25%,最终超大参数模型训练性能达到 A100 的 93%。
第三,基于科学验证方案的模型参数训练优化。首次提出专家距离约束思想提升模型表示能力,训练效率提速超过 30%;并首次将超参数跨模型尺度迁移规律思想应用于万亿参数 MoE 模型,得到全尺寸模型的最佳训练范式,实现万亿参数模型高效训练。

作为最早布局大模型的央企机构,TeleAI 持续深耕原创技术的研发和落地,目前已打造全模态、全尺寸、全国产的“三全”星辰大模型体系,并积极推进模型开源,不断引领技术创新向产业应用快速跃迁。
面向不同的应用场景,星辰大模型提供语义、语音、视觉、多模态的全方位能力。其中,语义大模型 TeleChat 系列自首次发布以来,已迭代多个版本,并陆续开源 1B、3B、7B、12B、35B、39B(MoE)、52B 和 115B 多种参数规模,吸引了国内外广大开发者的讨论和使用。
凭借卓越的性能和开源生态贡献,星辰语义大模型在包括 SuperCLUE、C-Eval、OpenCompass 等权威榜单成绩显著,排名第一梯队;在 Gitee 开源社区获得“GVP-Gitee 最有价值开源项目”;并荣获中国信息通信研究院(信通院)“可信开源大模型成熟度能力”认证、“2024 年度央国企开源项目典型案例”,及中国科协开源创新榜评选“2024 年度开源应用场景奖”。
为全面落实“AI+”行动,星辰大模型已渗透进入多种行业和应用场景,完成工业、应急、教育等领域超 50 个行业大模型建设。例如,在政务场景聚焦智能对话、智能工单、智能质检等多种需求;在教育领域打造“学、测、评”一体化智能应用。
结合大模型技术的创新和落地,TeleAI 还通过对家族式同源模型协同的深入研究,进一步探索智传网(AI Flow)的创新和应用,并与 AI 治理、智能光电(包含具身智能)、智能体形成“一治+三智”完整科研布局。

坚持以科技创新为动力,以技术普惠为己任,TeleAI 目标通过开源与广大开发者共同探索更多大模型与产业结合的创新路径,打通并发展“AI 驱动的三大空间经济”,全面赋能赛博空间、临地空间、广域空间,不断拓展人类的认知和活动边界。