百度慧播星发布新一代NOVA数字人
还记得今年618期间,罗永浩的数字人直播首秀一度掀起了全网讨论热潮。
当时,出现在百度直播间里的“罗永浩”和搭档“朱萧木”,被不少观众以为是真人,想方设法找出“破绽”。
可以说,无论是身形、样貌、声音,还是实时互动的能力,罗永浩数字人的表现几乎都与真人无异。
更加出人意料的是,这场6个小时的数字人直播,最终吸引了超过1300万人次观看,GMV突破5500万元,甚至在部分3C、食品等核心品类方面,数字人带货单量比此前罗永浩的真人直播成绩还要好。
如此亮眼的效果和成绩,很快就让罗永浩数字人直播吸引了业内的高度关注、媒体的争相报道,比如海外的权威媒体CNBC更是评价称:“这是中国与数字人行业的DeepSeek时刻”。
毫无疑问,对于直播电商行业而言,罗永浩的数字人直播可谓是一场里程碑事件,标志着数字人技术已经高度成熟,并在落地应用的过程中展现出了媲美真人、超越真人的效果。
当然,技术的突破是一方面,让很多从业者更加关心的是,罗永浩数字人直播的效果能否被复制?中小体量的直播间能否享受到最新技术释放的红利?
对此,为罗永浩数字人直播提供技术支持的百度慧播星数字人平台给出了答案。
7月26日的世界人工智能大会现场,百度慧播星发布了新一代数字人技术“NOVA”,宣布以罗永浩数字人为蓝本的新一代技术实现了平台化,预计将于今年10月正式上线。
该技术实现了三大核心突破:依托文心大模型4.5Turbo的大师级剧本模式,能生成优质脚本并驱动多模态协同,让数字人在直播间实现形神音容的高度匹配;搭载的 AI 大脑可实时接收直播数据并自主决策,调度多智能体完成问答互动,并结合热点输出风格化内容;高效复刻能力仅需10分钟真人样本,就能完成声情动作复刻,实现声音、动作与氛围的精准匹配。
同时,得益于其低门槛、高表现力的特点,能够将罗永浩数字人的能力,复刻到每一个主播身上,“让每一个人通过自己的数字人,都能变身超级主播,让人人都有机会成为罗永浩”。
截至目前,百度慧播星已经邀请了教育、健康等十余个行业的商家和达人,利用最新的NOVA技术打造了自己的数字人分身进行直播,且都取得了不错的成绩。像是知识博主艾弥儿的数字人凭借万亿级知识库,将用户停留时长提升101%;蒙牛悠瑞的数字人通过全时段服务与动态策略,使转化率提高 33%。
随着NOVA陆续向更多的商家和达人开放,普通用户也可获得媲美头部主播的专业带货能力,这标志着超头主播能力复刻进入规模化量产时代,更有望重构直播电商生态,推动行业的新一轮变革。
三大核心突破,数字人正在超越真人
作为业界首个AI全栈式数字人直播解决方案,百度慧播星一直以来都在持续探索数字人技术新的可能。
而新一代数字人技术NOVA的发布,则意味着类似罗永浩数字人的体验,将得到规模化的落地应用。
在这背后,是NOVA围绕数字人的大师级剧本模式、AI大脑、高效复刻能力实现了三大核心突破,最终借助六大能力的支撑,让数字人的表现力和效果“更逼真”“更智能”。
“更逼真”方面,NOVA针对数字人的剧本、动作和声音,进行了新一轮升级。
早在今年4月,慧播星就首次发布了“剧本模式”,能够实现数字人“神、形、声、貌”的多模态统一。
而如今,最新升级后的NOVA推出了大师级剧本模式,将角色、动作、声音、氛围等剧本要素及参考信息输入给文心大模型后,大模型便会通过深度学习、调动亿万级知识储备,产出具备多种风格的高质量剧本内容,而后再通过驱动多模态协同,实现直播间神形音容的高度统一。
因此在直播中,我们能看到数字人主播根据剧本要素说明、商品信息、人设要求等参考信息,实时调整语调、表情和动作,表现出的情绪转换与动作衔接如同真人般自然流畅。
此外,在动作上,NOVA支持动作生成功能,表现力得到全面提升,即使是双人互动看起来也毫无违和感。
比如此前的罗永浩数字人直播中,我们看到搭档的数字人能够注视并认真倾听对方说话,二人同时讲解时的衔接也自然流畅、配合默契。带货时,还支持持品动作生成,并与货品互动,足以体现NOVA数字人应对复杂场景的强大能力。
至于声音的高度还原,对于NOVA来说就更不在话下了。其不仅打破了大众对于数字人“机械音”的刻板印象,做到了说话抑扬顿挫的“超拟真”,而且还支持打断说、同时说等双人对话场景。配合剧本模式,数字人主播更是可以做到“有感情”“有风格”,连真人主播的口头禅等都能完美复刻。
“更智能”方面,主要体现在NOVA对于脚本、问答、互动三大能力的支撑。
以往的数字人主播,很多都只能做到“照本宣科”,或者对于部分问题能有预设好的回答。但这一方面显得很生硬,无法回答部分问题,会影响到消费者体验;另一方面还需要直播间的运营人员前期做很多准备,人力投入同样不小。
而NOVA得益于百度长期以来沉淀的技术实力,拥有着一颗超强的“AI大脑”,不仅可以深度学习人设脚本,还原个性化的带货风格,还能在直播中自主思考进行灵活决策,进而调度多智能体实现与用户的问答与互动。
简单来说就是,NOVA已经不再局限于精准回答用户的问题,更是能够结合时事热点,有趣味、高情商地与用户互动。
比如此前的罗永浩数字人直播我们就看到,数字人甚至还能时不时抛出几个段子炒热直播间的氛围。当有观众提及关注度很高的“苏超”足球比赛时,数字人罗永浩幽默地回应称:“我知道苏超最近挺火的,什么比赛第一友谊第十四,热梗挺多的,我建议国足也和苏超学学。”
由此可见,NOVA数字人能够高度还原主播的个人风格,不仅接住了用户的问题,还巧妙地进行了联想和展开,给观众带来了几乎与罗永浩本人无异的体验。
不仅如此,相比于真人主播,NOVA数字人还有一大优势就是比人更“聪明”。对于这一点,全网千万粉丝的达人艾弥儿就深有感触。