返回
新闻中心detailTitleIcon新闻详情

中国电信发布全自研视频生成大模型和TeleSearch 2.0 完成全模态体系构建

2024-12-03 16:31

12月3日,在中国电信“2024数字科技生态大会”上,中电信人工智能科技有限公司和中国电信人工智能研究院(TeleAI)发布视频生成大模型、视觉大模型产用一体化平台,星辰大模型系列进一步完成了其全模态能力的构建;同时还发布具身智能、智传网等一系列创新产品及科研成果。

newsPicUrl

从0到1完成了VAST 二阶段视频生成技术的研发,实现从文字到分镜图和从分镜图到视频的端到端生成,在主体目标时空一致性、个体复杂动作精准控制、交互式动作精确控制及角色动作符合物理规律等核心技术上实现领先。该能力的推出标志着中国电信成为首家具备视觉、语音、语义、多模态全模态能力的央企,有望落地广告传媒、文旅教育等领域。未来,通过整合语义、语音、文生图、文生视频等全栈大模型能力打通短剧及影视制作的各个环节,覆盖文字脚本撰写、分镜脚本绘制、视频拍摄及剪辑、配音及音效合成等全流程,提升短剧创作体验,实现降本增效。目前,TeleAI 视频生成大模型在权威视频生成评测榜单VBench中排名第一。

newsPicUrl

星辰视觉大模型现已升级至TeleSearch 2.0-基于知识的视图万物布控,成为业内首个基于知识的万物布控视觉大模型,实现了基于自定义规则的视频流检索和实时告警。TeleSearch 2.0 不仅打破了传统模态间的信息孤岛,还可根据复杂长语句描述对图像与视频内容进行精确检索,实现跨模态复杂语义的精准理解,以及超万种目标的精准检索。

依托TeleSearch2.0, 构建自研视觉大模型产用一体化平台,利用大模型基座和工程化应用,革新了传统的算法生产流程,赋能政务、应急、工业、能源等行业的开发人员全流程提效。目前,该平台已成功应用于多省应急项目,沉淀了20余个应急全流程感知场景,提升对灾害研判与应急响应的核心能力。

newsPicUrl

此外,在本次数字科技生态大会的线下展台,TeleAI 还展示了一系列在具身智能方向的创新成果,包括可以用于生活服务的人形机器人、面向商场及展会场景的星小辰服务机器人、为视障人士提供导盲服务的智能机器狗,及整合了一系列大模型能力的AI智能眼镜;展出了星辰软件工厂、星辰慧记、星辰智能体产品、中国电信家庭小管家、星辰大模型一体机等一系列智能产品。

电信人工智能公司和TeleAI研究院,将持续突破人工智能的技术攻关、持续为各类客户提供更加智能的产品方案、持续向开发者提供更优的生态环境和研发平台。