返回
新闻中心detailTitleIcon新闻详情
TeleAI 以智传网(AI Flow)为理论基础,构建“世界模型”创新系统
2025-11-04 16:17中国电信人工智能研究院(TeleAI)

17 至 19 世纪,以牛顿力学为核心的经典物理体系逐渐完善,为人类构建了一个全新的认知框架,只要知道物体的初始状态和受力,就能精准预测其未来的运动轨迹。这种“确定性”认知,让人类相信物理世界是可以被理解、被预测的。

例如,基于“力与运动的转化规律”,瓦特对蒸汽机进行改良,开启了第一次工业革命的序幕,使人类从手工生产迈向机器大生产的时代。通过计算“作用力与反作用力”,当升力大于或等于自身重力时,飞机就能摆脱地面束缚,在空中自由飞行。

经典物理体系的建立让人类从“经验驱动”转向“规律驱动”。而随着人工智能的快速发展,自动驾驶汽车、自主驱动机器人正逐渐走进人们的生活,促使 AI 不能仅停留在对文本符号的处理,还要真正认识和理解物理世界,应对真实场景中各种随机的可能性。

newsPicUrl

因此,“世界模型”应运而生,它是一种能够对现实世界环境进行仿真,并基于文本、图像、视频和运动等输入数据来生成视频、预测未来状态的生成式 AI 模型。世界模型是用于模拟环境动态并预测未来状态的核心技术框架,被视为实现 AGI 的关键路径。

近日,中国电信人工智能研究院(TeleAI)以智传网(AI Flow)的信容律、同源律、集成律为理论基础,在世界模型的技术和应用方面展开研究,构建一套具备多模态融合、长时序稳定性与实时交互能力的新一代世界模型系统。

结合在涉水光学、涉水视觉等智能光电相关领域的研究成果,TeleAI 打造的世界模型将在水下具身智能应用、海底光缆铺设等真实场景中发挥重要价值,对深海环境进行感知、理解和重建,实现更高效的导航规划和任务执行。

newsPicUrl

构建高精度预测与

强泛化能力的世界模型

世界模型使 AI 能够具备类似人类的认知和推理能力,在一个虚拟的“脑海”中进行模拟和规划,从而更好地应对现实世界的复杂性,同时也面临着诸多挑战和难题。

挑战1:高维时空动态实时感知与建模。

真实世界是包含三维空间及其随时间演化的四维连续体,蕴含的信息量极为庞大。世界模型要准确反映环境动态,必须能够实时感知并更新这个高维时空状态。然而,对如此海量且连续变化的数据进行高效处理、压缩与快速更新,面临着巨大的计算复杂度与显存带宽压力,这使得实现低延迟、高效率的更新与预测变得异常困难。

挑战2:多模态信息融合与表征统一。

构建能够同时处理并理解物多种模态信息的统一框架,是实现全面世界认知的关键。然而,现有方法在不同模态的数据表征间存在对齐困难、信息冗余与语义鸿沟等问题,缺乏一个能够深度融合与协同不同来源信息的统一学习范式。这限制了模型在复杂场景下进行跨模态推理与整体情境理解的能力。

挑战3:长时序建模中的误差累积与一致性保持。

世界模型在生成或预测未来序列时,其单步的微小预测误差会随着时间推移不断累积与放大,导致生成内容逐渐偏离合理轨迹,出现逻辑矛盾或物理失真的现象。对于需要长期记忆与连贯推理的真实世界应用(如长期规划与决策)而言,模型在长时序任务中的一致性与可靠性仍显不足。

newsPicUrl

TeleAI 世界模型架构设计示意图

为了应对这些挑战,TeleAI 团队构建了一种创新的流式“四维时空体”,以“生成-重建-引导”为循环来创建四维世界。TeleAI 致力于突破世界模型在因果关系和物理规律建模方面的关键技术瓶颈,构建具备高精度预测能力和强泛化性的世界模型系统,对破解技术难点、推动产业升级具有重要意义。

第一,构建实时更新的原生四维世界模型。

通过创建“生成-重建-引导”的模型框架,能随新观测(如视频帧)即时演化相应的四维时空表征系统。它强调在统一的坐标系中,实现动态物体与静态背景几何的一致性融合,从而形成一个连贯且实时同步的模拟世界,为生成模型提供精准的环境表示引导。

newsPicUrl

第二,建立统一的多任务与多模态框架。

通过设计单一模型架构替代以往为不同任务定制的多个独立模型,实现训练与部署的简化。利用多模态信息(如视觉、深度、点云、分割等)的协同与互补,增强模型表征的鲁棒性,促进知识在生成与理解任务间的正向迁移,提升模型的整体性能与泛化能力。

newsPicUrl

第三,采用“宏观-微观”双规划层与长效记忆机制。

将长序列生成任务分解为片段级规划(宏观)与帧级细化(微观)。通过将时序依赖关系从帧级提升至片段级,支持并行预测,大幅提升了生成效率。同时,引入长效记忆模块使模型能持续追踪历史上下文,有效维持长程一致性。

newsPicUrl

作为 TeleAI “一治+三智”战略科研布局的重点之一,智传网(AI Flow)在世界模型构建和应用中也将发挥重要作用。

基于分布式“端-边-云”协同架构,智传网(AI Flow)的边缘节点能为终端设备提供中等计算能力和相对较低的传输延迟,可接管对延迟敏感的工作负载,并将计算密集型操作卸载到云端集群,从而应对高维时空动态实时感知与建模过程中对带宽的需求。

newsPicUrl

同时,以信容律为理论指导,还可以通过定制一系列大小不等且同源的家族模型,根据不同的任务和计算资源进行优化,从而提升模型在长时序建模中的效率和准确性,有助于保持一致性,减少误差累积。

此外,部署在不同计算节点的家族式同源模型由于具备已对齐的隐含特征,可实现无开销的信息共享和有效协作。这使模型能像“变焦镜头”一样灵活伸缩,在协同工作时复用计算结果,避免重复劳动,从而更好地处理多模态信息,减少信息冗余。

当前,世界模型发展迅速,正逐渐从理论探索进入到技术融合与应用拓展的关键时期。例如,在自动驾驶领域,世界模型将显著提升车辆对环境的预测与决策能力,使其能够像经验丰富的驾驶员一样理解和预测周围环境的动态变化,提高可靠性。

newsPicUrl

面对复杂多变的深海环境,世界模型可以整合多源数据,构建高精度的深海环境模型,为深海勘探和水下作业提供全面、准确的环境信息,帮助作业人员更好地了解作业区域的地质构造、地形地貌等情况,从而制定更合理的作业方案。

作为央企新型研发机构,TeleAI 致力于为新一代人工智能技术体系的构建提供重要支撑,将通过整合智传网(AI Flow)、大模型、具身智能、世界模型等前沿技术,推动构建并形成新型 AI 产业集群,全面提升我国的科技竞争力和产业影响力。