当前位置: 首页 » 资讯 » 新科技 » 正文

全球首发!百度蒸汽机2.0视频生成模型上线多人有声版

IP属地 中国·北京 编辑:柳晴雪 TechWeb 时间:2025-08-21 20:25:35

8月21日消息,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。

即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。

据介绍,百度蒸汽机是全球首个中文音视频一体化生成的I2V模型,不仅支持环境音效,更支持多角色语音的一体化生成。百度蒸汽机2.0有声版模型让AIGC视频创作彻底告别了配音,创作者对完美视听语言的一切想象,只需要一张图和提示词。

这背后依托于百度蒸汽机视频模型的五大核心技术突破:行业首次实现多人有声音视频一体化生成,语音与唇形、表情、动作的毫秒级精准对齐,复杂场景下依然稳定;首创多模态潜在空间规划技术(Latent Multi-Modal Planner),自主协调多角色身份、情感与互动逻辑,保障电影级叙事连贯性;中文场景深度适配,以超98%的还原度精准呈现中文语音细节与情感表达;端到端电影级画质生成,通过精准主体动态刻画,打造真实细腻的人物表现力;大师级运镜控制,内置数十种专业镜头语言,精准响应文本指令,实现视觉细节与创意意图的完美对齐。

价格方面,针对不同需求用户,百度蒸汽机平台提供了梯度会员服务,价格低至行业同类产品的70%,生成5s视频仅需1.4元。

除此之外,新用户注册即可免费获得部分想象力值,平台还将在每周四创新推出"狂欢星期四"抽奖活动,用户最高可获18888点想象力值,实现"视频生成自由"。同时,基于持续丰富的特效能力,平台月月有生动有趣的特效赛事发布,参加即有机会赢得数万元大奖。(果青)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。