12月3日,中国电信在广州举办了首届“TeleAI 开发者大会”,这是在“2024数字科技生态大会”期间举行的一次重要活动。会上,TeleAI发布了视频生成大模型、视觉大模型产用一体化平台、具身智能和智传网等一系列创新技术、产品及科研成果,并宣布了开发者产业联盟计划。中国电信总经理梁宝俊出席并致辞,CTO、首席科学家、人工智能研究院(TeleAI)院长李学龙发表了主旨演讲。
梁宝俊指出,随着信息技术的迅猛发展,人工智能已成为新一轮科技革命和产业变革的重要力量。中国电信积极响应国家号召,全面深化改革,强化科技自主创新和技术攻关,率先布局人工智能战略发展,积极推进“AI+”行动。未来,中国电信将携手中电信人工智能公司和TeleAI研究院,持续突破人工智能的技术难关,为客户提供更加智能的产品方案,为开发者提供更优的生态环境和研发平台。
本次发布的视频生成大模型采用了“VAST(Video As Storyboard from Text)二阶段视频生成技术”,通过文本描述精准勾勒出包含视频构图、主体目标位置及人物姿态等关键信息的“故事板”,进而生成对应的视频内容。这项技术能够保证单个或多个主体人物在各视频片段中的外观一致性,实现对复杂动作和交互式动作的精确控制,并让角色和目标物体的运动符合物理规律。基于此,通过语义、语音、文生图、文生视频等全栈大模型能力打通短剧及影视制作的各个环节,覆盖文字脚本撰写、分镜脚本绘制、视频拍摄及剪辑、配音及音效合成等全流程,从而实现降本增效。目前,TeleAI 视频生成大模型在权威视频生成评测榜单VBench中排名第一。