当前位置：首页 » 资讯 » 新科技 » 正文

高拟真数字人直播带货有多强

IP属地中国·北京 北青网-北京青年报 时间：2025-11-10 10:11:02

当直播时长逼近6个小时、大多数电商主播显露疲态时，百度直播间里的主播“罗永浩”和搭档“朱萧木”仍然可以情绪饱满地回答观众提问，时不时还能讲两句“段子”，吸引观众下单。这两位主播并非真人，而是百度借助剧本驱动多模协同数字人技术打造的数字人主播。
在2025年世界互联网大会乌镇峰会上，由百度自主研发的剧本驱动多模协同的高拟真数字人技术获得世界互联网大会领先科技奖。
随着人工智能技术快速发展，大模型向多模态加速演进，数字人成为融合大语言模型与多模态技术的创新应用，电商直播是数字人落地的极佳场景。数字人技术使商家无需投入大量人力、物力进行现场直播，能显著降低场地租赁、设备采购、人员培训等费用。同时，数字人可以24小时不间断直播，进一步增加商品曝光时间和销售机会，提升经济效益。
但传统数字人生成技术常面临语音、语言、视觉多模态割裂的问题，表现为台词生硬、语音语调与台词情感匹配不佳、表情手势单一等。百度首席技术官王海峰说，针对数字人应用痛点，百度创新研发了剧本驱动多模协同的高拟真数字人技术。
剧本的基础是台词。台词生成不仅是内容输出，还要贴合主播人设与语言风格，确保语言表达的个性化与一致性；在多主播场景中，还需实现语义逻辑、语调节奏和情感风格的整体协调。同时，为提升台词的内容深度，还要引入内容规划、知识增强与事实校验机制，以降低人工智能幻觉风险。基于台词，大模型可以直接生成一份数字人直播剧本。剧本自带“视觉标签”和“语音标签”，它能够告诉系统，对应台词人物要做出哪些动作。
互动性强是电商直播场景的一大特点。在与观众互动过程中，语音合成的自然度是决定用户沉浸感的关键因素。观众希望听到主播有情绪、有起伏的声音，而不是生硬机械的朗读。王海峰介绍，针对这一需求，百度提出了“文本自控的语音合成”方案。文本自控的语音合成大模型不仅具备高复原的语音合成能力，还能够结合直播台词及主播个人特征，把这些文本内容转化为自然、有感染力的声音，让数字人不仅能发出声音，更能精准传递出调侃、得意、强调等细微情绪。
除了要和用户交互，数字人主播在直播时还要与商品和所在空间进行符合物理逻辑的互动。如何做到这一点？高一致性超拟真数字人长视频生成技术，能对输入的历史视频数据、剧本脚本、语音信息以及骨骼驱动等多模态信号进行分析与理解，并基于此分别生成高表现力片段、复杂“人—物—场”交互片段以及大动作大表情片段。系统能够对这些片段在较长时间跨度上进行统一调度，确保语音、口型、表情与动作始终保持高度一致且同步。
如今，数字人正逐渐从实验室走向各类应用场景，商业化进程显著加快。可以预见，随着深度思考、多模态交互等关键能力的跃升，还将有越来越多数字人出现在屏幕上，走进人们的生活中。同时，业内专家提醒，《直播电商监督管理办法（征求意见稿）》提出，使用人工智能等技术生成的人物图像、视频从事直播营销活动的，直播间运营者应当在直播页面进行显著标识，持续向消费者提示该人物图像、视频属于人工智能等技术生成，以与自然人名义或者形象进行明显区分。
中国科学院信息工程研究所正高级工程师韩冀中说，人们在拥抱数字人技术的同时，也需设立清晰的边界，必须防止利用高拟真技术以假乱真进行欺诈或虚假宣传。技术的发展必须与法律、伦理的约束并行，确保创新在正确的轨道上行稳致远。（本报记者都芃）
（科技日报）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

特斯拉股东大会通过马斯克万亿薪酬方案人形机器人、Cybercab将量产｜一周市场观察

苹果+华为占比超6成 OLED平板发力渗透率创历史新高

突然，涨价50%！芯片，重大突发！

美国AI巨头股缩水8000亿美元；传Meta靠诈骗广告收入超千亿；《英雄联盟》S15总决赛T1夺冠｜极客早知道

币圈连遭血洗，“给币加杠杆”的“数字币财库公司”崩了

澜起科技推出支持9200MT/s速率的DDR5时钟驱动器(CKD)芯片

全站最新

特斯拉股东大会通过马斯克万亿薪酬方案人形机器人、Cybercab将量产｜一周市场观察

苹果+华为占比超6成 OLED平板发力渗透率创历史新高

突然，涨价50%！芯片，重大突发！

美国AI巨头股缩水8000亿美元；传Meta靠诈骗广告收入超千亿；《英雄联盟》S15总决赛T1夺冠｜极客早知道

热门推荐

山姆的下一战：不是Costco，而是天猫？

裁了4000人，但雅诗兰黛靠中国富人赚钱了

“资本高手”均胜电子，上市第一天就被教育了

AI玩具看着很美，但离成功还很远

鼎龙系“租壳”中元股份：一笔非典型的“轻资产”式易主

疯批冷美人、返祖中医男爆红！荒野求生“发疯”背后是一场大生意

“钢铁大亨”投资“口罩大王”，两个月浮盈近10亿

台积电2nm/3nm制程晶圆调价，苹果高通小米等芯片成本将显著上升

Meta被曝去年160亿美元收入来自诈骗广告，用户日接150亿条欺诈信息

小米汽车产能扩张迅猛，2026年目标直指120万辆

中国笔记本市场迎来“高端化”浪潮：线上均价破6800元，万元机销量激增78%

4.99万元起！京东第一辆车价格定了

华为Mate80 RS或配备双长焦：华为Pura 80 Ultra同款

DeepSeek-R1之后，Kimi K2 Thinking又给OpenAI们亿点点震撼

因天气原因，贝索斯旗下蓝色起源新格伦火箭第二次发射再次推迟