IT之家 12 月 4 日消息,据可灵官方公众号,全新一代可灵数字人 2.0 即日起全量上线,经过上传角色图 → 添加配音内容 → 描述角色表现三个步骤,即可生成“能说会演”的数字人。
![]()
根据介绍,本次更新针对旧版带来了三大突破性改变:表现力拉满、手部及口型精准控制、支持最长 5 分钟内容。其“精通”体态动作、手势、表情、镜头语言,可做到更生动的情绪传达。
据IT之家了解,可灵 AI 于今年 9 月推出数字人功能。当时,通过一张角色图片加一段文字或音频,即可生成 1080p / 48FPS、最长 1 分钟的数字人视频。该数字人功能基于多模态理解与视频生成模型的深度结合,实现了口型精准同步以及情绪动作的精细控制。其采用的基于 Transformer 的 DiT 架构,在处理时序信息和细粒度控制方面具有独特优势,能够精准解析面部特征、理解音频语义,并根据语音内容推断合适的面部表情和微动作,从而确保生成的数字人在视频全程保持角色一致性。





京公网安备 11011402013531号