当前位置：首页 » 资讯 » 新零售 » 正文

Character.AI突破性技术：实时AI角色视频互动

IP属地中国·北京 编辑：李娜 IT之家 时间：2025-07-05 14:51:56

7 月 5 日消息，AI 聊天机器人平台 Character.AI 发布研究论文和视频演示，展示了名为 TalkingMachines 的自回归扩散模型，让 AI 角色互动更加逼真。
该模型尚未部署在 Character.AI 平台上，根据研究论文和视频演示，用户只需要输入一张图片和声音信号，该模型就能实现类似 FaceTime 的通话视觉互动。
该模型基于 Diffusion Transformer（DiT）技术，本质上是一种能够从随机噪声中创建详细图像的“艺术家”，并不断优化图像直至完美。Character.AI 所做的就是让这一过程变得极其迅速，达到实时效果。
TalkingMachines 模型采用了流匹配扩散（Flow-Matched Diffusion）、音频驱动的交叉注意力（Audio-Driven Cross Attention）、稀疏因果注意力（Sparse Causal Attention）和不对称蒸馏（Asymmetric Distillation）等多种关键技术。
其中流匹配扩散技术通过训练大量动作，包括细微的面部表情和更夸张的手势，确保 AI 角色动作更加自然。音频驱动的交叉注意力技术则让 AI 不仅能听到单词，还能理解音频中的节奏、停顿和语调，并将其转化为精确的口型、点头和眨眼。
稀疏因果注意力技术让 Character.AI 能够以更高效的方式处理视频帧，而不对称蒸馏技术则让视频能够实时生成，营造出类似 FaceTime 通话的效果。
Character.AI 强调，这一研究突破不仅仅是关于面部动画的，它是朝向实时互动的音频视觉 AI 角色迈出的一步。该模型支真实感人类、动漫和 3D 虚拟形象等多种风格。

标签：技术模型视频音频角色聊天 注意力 交叉视觉 真实感 艺术家 风格声音人类图像形象信号 机器人 平台动作节奏动漫图片效果 突破性 通话论文消息大量语调部署用户

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

“吃+喝”大文章

6月1日开始入户调查，每家每户都可能轮到，请积极配合

体验千问内淘宝后，我发现自己低估了AI购物

杭州一街道被电商拉黑背后，一场由“无理由退货”引爆的规则战争

3000亿宠物市场“还远未到内卷的程度”，淘天宠物已孵化60多个过亿品牌

史上最离谱：CEO卖袜子筹3810亿，买电商鼻祖

全站最新

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

热门推荐

彭博：中国汽车正在“占领”从巴西到南非的每一条道路

“吃+喝”大文章

6月1日开始入户调查，每家每户都可能轮到，请积极配合

体验千问内淘宝后，我发现自己低估了AI购物

杭州一街道被电商拉黑背后，一场由“无理由退货”引爆的规则战争

3000亿宠物市场“还远未到内卷的程度”，淘天宠物已孵化60多个过亿品牌

百联股份：公司已成功发行华安百联消费REIT，并正推进扩募储备

史上最离谱：CEO卖袜子筹3810亿，买电商鼻祖

阿里财报：Q4云外部收入增长加速至40%，电商CMR增长8%

夯爆了的年轻人，正在吃透百元购买力

马光远：现在的市场的确像极了1999年泡沫破灭前

市场监管总局：一季度全国新设经营主体509.8万户

国机汽车：全资子公司签署1.09亿元经营合同

长鹰硬科即将上会：两名创始股东退出董监，2025年经营现金流转负

机构：一季度国内消费级XR市场销量同比增长63%