当前位置: 首页 » 资讯 » 新零售 » 正文

罗永浩“分身”卖爆5500万,百度藏了什么技术底牌?

IP属地 中国·北京 编辑:赵静 硅基研究室 时间:2025-06-19 12:03:12
数字人技术的四大突破

文 |

今年的618又怎么能少了AI?

和别人遮遮掩掩说数字人不同,罗永浩在618前夕,高调在百度亮相自己的数字人结果,效果把自己也吓了一跳。

屏幕里的罗永浩熟练地摆弄着产品,和同为数字人的助播朱萧木插科打诨,用标志性的罗氏幽默拆解产品卖点观众几乎难以察觉,这两个侃侃而谈的主播,实则是由千万行代码与尖端算法构建的虚拟形象。

百度副总裁、电商总经理平晓黎昨天(6月17日),在百度AI Day开放日透露,罗永浩数字人已达到媲美超头主播的体感效果,随着大模型与多模能力发展,数字人未来超越真人效果极具潜力。

要说还真是老罗会玩。

这场持续超6小时的直播,最终以1300万人次围观、5500万元GMV的成绩收官,部分品类超过真人同期带货成绩,不仅刷新数字人带货纪录,更在电商行业投下重磅炸弹:当AI突破照本宣科的桎梏,开始创造超越真人的商业价值,数字人直播的未来将走向何方?

1、AI主播扛起千万流量

令很多人意外的是,6月15日罗永浩的这场数字人首秀里,其中部分3C、食品等核心品类商品带货单量,超罗永浩5月真人首秀同期数据,互动次数比真人直播间超3倍。

不要小看这一突破,这意味着数字人带货力不及真人的固有认知或将被打破,也让行业意识到AI主播的商业潜力。

实际上,在数字人直播这片红海,抖音、快手、京东等巨头也早已重兵布局。去年4月,采销东哥(刘强东数字人),登陆京东直播间,一度引起行业关注。

但行业内目前主流数字人的直播,往往多聚焦于形象复刻,在互动流畅度、内容深度和直播时长上存在明显短板。

例如部分平台数字人仅能完成预设台词播报,面对复杂弹幕提问时容易卡壳;直播时长普遍不超过2小时,难以满足商家长效经营需求。

但这次百度交出的答卷,却让行业看到了更多的技术沉淀。

从超长时间稳定输出,到双数字人默契互动,百度用实力证明:数字人直播绝非简单的虚拟克隆,而是一场需要深厚技术积累的攻坚战。

更关键的是,这次直播撕开了行业另一个更为关键的固有格局。

过去,头部主播真人出镜是铁律,数字人多在中腰部账号试水。如今百度让罗永浩数字人成功带货,意味着数字人技术已能承载顶级流量。

而其大幅降低的直播门槛,更让无数普通人看到希望哪怕不善言辞,也能借数字人圆主播梦。

可以这么说,这场破圈直播,正悄然重写电商直播的竞争版图。

2、百度数字人技术的四大突破

传统数字人直播常像一场尴尬的独角戏,卡顿、僵硬的画面难以长时间留住观众。但百度这次带来的双人相声式直播,彻底颠覆了人们的想象。

罗永浩与助播朱萧木的数字人搭档,在直播间里配合自然、你来我往,不断相互调侃,金句频出,在喝奶茶、拎可乐的同时,还能做出相互对视、异口同声说话等细节动作。

在推荐康师傅方便面时,老罗熟练地用筷子挑起面条,嘴上不停介绍,而一边朱潇木,那表情就像闻到了方便面的香气一样,整个场景真实逼真,情绪价值瞬间拉满,让直播间的用户不由地下单支持。

这场超6小时的超长直播,其实是对数字人技术实力的残酷考验。

今年4月百度发布的高说服力数字人已让数字人带入3.0时代,新一代高说服力数字人成为了一个像真人一样,形神音容高度协调、会思考决策、能协作完成特定任务的超级智能体。

这次在高说服力数字人的基础之上,百度电商慧播星再一次迭代,围绕慧播星首席体验官罗永浩,发布了业界首个超头主播的数字人,更是实现了体验、内容、视觉、效果的四大突破。

百度相关技术团队透露,让数字人在长时间里保持一致性和高拟真性的表现力,需要解决一系列问题,并不是一个单一的模型就可以解决所有问题。

为此百度建设了数字人形象生成和驱动的一整套技术。这个技术是一个可控的、长视频的生成工作,通过视频、剧本、语言、骨骼等特征,进行知识的输出,通过视频生成大模型,最后能够生成多模协同的视频片段,完成高一致性长视频的生成。而让数字人具备多模协同、高表现力、复杂交互等,这是一个对大模型集大成的使用。

直播中的一个细节,让网友直呼细思极恐:当老罗口头提到抬头纹、法令纹、颈纹的时候,数字人老罗也配合手部动作指出了相应的位置,几乎与真人无异。

同时,面对直播间每秒上千条的弹幕,数字人展现出的实时互动能力同样惊人。据悉,罗永浩数字人整场直播AI调用知识库1.3万次,从而快速匹配答案,生成了9.7万字精准且风趣的产品讲解。

于是,我们看到无论是3C数码产品参数的硬核解析,还是零食口味的细腻描述,数字人都能信手拈来,互动效率远超真人主播。

实际上,基于最新的文心4.5T,通过深度训练,大模型不再局限简单的脚本生成,而是做到了既懂创作、更懂用户,构建起从内容创作到行为决策的完整生态。

正因如此,在脚本生成环节,AI不再是机械的文字搬运工,而是能模仿罗永浩的罗氏幽默,结合实时热点即兴创作话术;多模态融合技术则赋予数字人灵魂,让声音的抑扬顿挫、表情的细微变化、动作的精准表达高度统一,营造出沉浸式的直播体验。

当直播间热度下降,数字人还能自动分析实时数据,切换互动玩法、调整产品推荐策略,就像一位经验老道的直播操盘手。

3、数字人风暴或将来袭

罗永浩数字人的成功,正在引发行业的蝴蝶效应。

对电商直播行业来说,数字人24小时不间断直播的特性,彻底打破了真人主播的时间壁垒。

此前百度方面的数据显示,慧播星可使直播运营成本下降超80%,GMV平均提升62%,转化率平均提升83%,

东北三农创作者翠花借助数字人直播间,将黑土地的农产品销往全国,订单量暴增10倍;陈皮商家广芸堂通过数字人360度展示原料生长环境,GMV实现160%的飞跃。这些真实案例证明,数字人直播正在成为中小商家逆袭的新武器。

在更广阔的领域,数字人技术的涟漪正在扩散。

教育领域,数字教师能根据学生学习数据实时调整教学策略;医疗领域,智能问诊数字人提供7×24小时的专业咨询;金融领域,理财顾问数字人实现千人千面的投资建议。百度聚焦垂直场景的技术路线,正在为这些应用场景搭建落地的桥梁。

百度创始人李彦宏曾说:数字人是百度大模型在多模态上的综合体现。

与追求通用功能的技术路线不同,百度选择深耕特定场景,让技术与商业需求深度绑定。

这种策略不仅降低了技术落地门槛,更开辟出可复制的商业模式。

随着梦蝶计划繁星计划的推进,百度正在搭建开放生态,未来或许会涌现出更多罗永浩数字人,推动行业迈向新的纪元。

当AI主播开始创造商业奇迹,这场始于直播间的技术革命,终将改写整个商业世界的规则。我们或许正站在一个新商业时代的入口,见证数字人与真人在商业舞台上的深度融合。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。