12月3日,随着中国电信“2024数字科技生态大会”的召开,首届“TeleAI 开发者大会”也在广州隆重举办,TeleAI发布视频生成大模型、视觉大模型产用一体化平台、具身智能、智传网等一系列创新技术、产品及科研成果,并发布开发者产业联盟计划。此次大会可以看作是中国电信在人工智能领域的一次重要布局,众多业内专家、学者和开发者莅临现场。
中国电信总经理梁宝俊出席并发表致辞,CTO、首席科学家、人工智能研究院(TeleAI)院长李学龙作主旨演讲。梁宝俊强调,在信息技术迅猛发展的今天,人工智能已成为推动新一轮科技革命和产业变革的关键力量。人工智能作为驱动新质生产力的重要引擎,正成为推进中国式现代化的先锋力量。中国电信将牢记使命担当,全面深化改革,强化科技自主创新和技术攻关,率先布局人工智能战略发展,积极推进“AI+”行动。
视频生成大模型:创新引领未来
会上,TeleAI发布了首个央企全自研的视频生成大模型“VAST(Video As Storyboard from Text)二阶段视频生成技术”。通过这项技术,用户只需输入文本描述,系统就能精准勾勒出包含视频构图、主体目标位置及人物姿态等关键信息的“故事板”(Storyboard),进而生成对应的视频内容。此创新不仅保证了单个或多个主体人物在各视频片段中的外观一致性,还实现了对复杂动作和交互式动作的精确控制,让角色和目标物体的运动更加符合物理规律。
通过VAST的创新,TeleAI视频生成大模型在短剧及影视制作领域展现出了巨大的潜力。它打通了从文字脚本撰写、分镜脚本绘制、视频拍摄及剪辑、配音及音效合成等全流程,实现了降本增效的显著效果。目前,该模型在权威视频生成评测榜单VBench中排名第一,展出出中国电信在人工智能领域的领先实力。
视觉大模型:万物布控,智能升级
除了视频生成大模型外,TeleAI还发布了基于知识的视图万物布控视觉大模型——TeleSearch 2.0。实现了动态知识挂载和行业事件认知,能够驱动复杂逻辑理解,打破了模态间的信息孤岛。TeleSearch 2.0支持上百个专业知识文档挂载,在理解文档内容的基础上,可根据复杂长语句精准检索图片和视频,完成跨模态复杂语义准确理解及超万种目标精准检索。
依托TeleSearch 2.0,中国电信构建了视觉大模型产用一体化平台。该平台通过算法冷启动回流数据,摆脱了传统模型对大量数据的依赖,实现了0训练数据直接推理,显著降低了算法应用的准入门槛。同时,平台还支持小样本训练,仅需100个样本数据就能训练出高精度模型,实现了模型生产的全自动化过程。目前,该平台已成功应用于多省应急项目,沉淀了20余个应急全流程感知场景,有效提升了灾害研判与应急响应的核心能力。
组建产业联盟 共建AI开发新生态
在首届TeleAI开发者大会上,CTO、首席科学家、人工智能研究院(TeleAI)院长李学龙以“当梦想照进现实”为题进行了分享并发布了星海AI中台、天翼AI开放平台、星辰智能体平台等开放平台,旨在助力开发者大幅降低开发门槛,构建低成本、高效率的创新开发生态。同时,李学龙还介绍了TeleAI在大模型全模态、全尺寸、全国产化体系构建的最新进展,以及智传网技术的前瞻布局。
大会期间,TeleAI还与华为、中兴、亚信科技等在内的19家合作伙伴共同发布了中国电信人工智能开发者产业联盟计划。这一计划旨在聚合各方力量,加快推动人工智能产业发展,提升技术能力与应用水平,并为全球开发者赋能。通过产业联盟的建立,TeleAI将携手合作伙伴共同探索人工智能的新领域、新应用,推动人工智能技术的不断创新与突破。
此外,在本次数字科技生态大会的线下展台,TeleAI 还展示了一系列在具身智能方向的创新成果,包括可以用于生活服务的人形机器人、面向商场及展会场景的星小辰服务机器人、为视障人士提供导盲服务的智能机器狗,及整合了一系列大模型能力的AI智能眼镜。展出了星辰软件工厂、星辰慧记、星辰智能体产品、中国电信家庭小管家、星辰大模型一体机等一系列智能产品,让现场观众真实感受未来已来,AI 就在每个人的身边。