当前位置: 首页 » 资讯 » 新科技 » 正文

从Sora2到蒸汽机2:被引爆的AI视频全球竞速

IP属地 中国·北京 编辑:孙雅 翼言商业观察 时间:2025-11-03 11:55:57
“AI视频生成领域,一定会诞生一个超级应用。”

翼言商业观察

10月以来,AI视频生成领域卷出了新高度。

上周,发布Vidu Q2图生视频不到2周,Vidu10月21日再次更新:参考生、时长最多可延长至五分钟、APP从AI创作平台转变为一站式AI内容社交平台。

生数科技的紧迫感并非孤例。上上周,10月15日,百度视频生成模型蒸汽机再次升级这已经是其7月 2日上线以来的第三次重大升级。

这两场密集发布背后,是10月1日OpenAI扔下的那颗炸弹。当天,Sora 2及其社交应用上线,凭借生成技术的突破和社交化的创新玩法,首周下载量超ChatGPT同期,OpenAI CEO山姆奥特曼偷GPU被抓与李小龙对打等内容席卷全网。

全球巨头的应激反应迅速展开。10月8日,埃隆马斯克xAI推出Imagine v0.9,以20秒快速生成、全用户免费发起反击;10月16日,谷歌发布Veo 3.1,强调物理引擎精准度,其Fast版本生成速度提升3倍。国内战场更显激烈:从百度蒸汽机到快手可灵,再到生数科技和好耶科技(FilmAction),都是国庆中秋8天无休的状态,快手研究院农雅晴直言:这个行业本来就很卷,节假日加班并不意外。

这场席卷全球的AI视频生成军备竞赛,早已超越单纯的技术比拼。从硅谷创业公司到中国互联网大厂,从OpenAI到谷歌,从百度、可灵到好耶、生数,近百亿美元资本与数千名工程师的投入,折射出科技产业对下一代内容交互革命的集体押注。喧嚣背后,技术突破与商业泡沫、创作平权与职业替代、创新红利与伦理风险的博弈,正将这个赛道推向更复杂的十字路口。

现象级爆发:Sora2点燃了火药桶

在Sora2最初放出的视频中,篮球投偏后反弹落地、花滑选手头顶一只猫完成三周半跳、雨滴落地后溅起,甚至多物体复杂场景的运动,都能精准模拟物理世界的运行规律。此外,Sora 2实现了原生音画同步,支持多语言对白与环境音效对齐,角色也能在多镜头中保持一致。这种接近影视级的生成效果,再次拉高了行业参照系。

丨Sora2生成的山姆奥特曼偷GPU

更具突破性的是其社交玩法:用户上传一张自拍照,输入在月球上跳舞,Sora 2就能生成10秒高复刻度的用户在月球跳舞的视频,还能通过Remix功能让好友加入共舞。山姆奥特曼的个人肖像权开放,网友脑洞大开的玩梗创作进一步放大了出圈效应。这种即时创作+社交裂变的模式,使Sora 2在邀请制下仍5天内登顶美国App Store免费榜,下载量突破1000万次,远超ChatGPT初期增速。

这场爆发并非偶然。

技术层面,无论是对物理世界的模拟精度还是音画同步、叙事和运镜能力,Sora 2显然都有了明显的提升。而它从视频生成工具升级为基于视频生成的社交化产品,更是为其出圈加了一把烈火。

对此,好耶科技创始人吴杰茜认为,当AI视频生成的技术提高、门槛降低之后,大众的视频化社交需求一定会被进一步激发,Sora 2的出圈显然说明,这是一个经过验证的产品方向。更重要的是,这极大提高了AI视频生成的大众关注度和认知度,给相关企业带来更多的市场机会。

当前,AI视频生成已经在电商、广告、短视频等多个领域开始落地,甚至参与影视制作:Netflix在2023年就发布了首部AIGC动画短片《犬与少年》;2024年,快手联合李少红、贾樟柯等九位知名导演开启了可灵AI导演共创计划,推出了9部AIGC电影短片;今年4月,新加坡上映了全球首部院线公映的AI电影《海上女王郑一嫂》,长达70分钟,成本尚不及传统方式的1/10。当制作商业视频的成本指数级下降,需求的爆发就顺理成章。

据Fortune Business Insights数据,2024年全球AI视频生成市场规模已达6.15亿美元,2025年将达到7.17亿美元,预计2032年将增至25.63亿美元,年复合增长率达20%。中金更为乐观,认为仅中期来看,创作者和B端生产力工具市场规模就有望突破100亿美元。

全球竞速:科技巨头的生存焦虑与创业公司的生死时速

Sora2的发布和出圈,瞬间激活了全球科技公司的神经。马斯克推出Imagine v0.9,主打电影级运镜,支持一镜到底生成;谷歌发布Veo 3.1和Veo3.1Fast,前者强调物理引擎精准度,后者则将生成速度提升3倍。

在国内,无论是科技大厂还是初创公司,这种竞速也在上演。与谷歌同日,百度10月15日发布蒸汽机升级版,支持无限时长生成和实时交互;生数科技10月21日推出Vidu Q2,首次上线视频延长功能,最长扩展至5分钟,其生成演技技术能精准控制人物微表情,确保同一角色在不同场景中的一致性。

丨百度蒸汽机在行业内首次实现AI长视频实时交互生成

值得一提的是,百度蒸汽机团队采用自回归扩散模型,并结合流式滑窗架构,在行业内首次实现了AI长视频实时交互生成:在生成过程中,用户可实时交互,随时改写内容或扩写续集,这意味着 AI 视频生成从 开盲盒一次性输出 进入 动态创作流 阶段。

丨Vidu Q2首页,玩法对标Sora2

Vidu 更是在社交玩法上直接对标Sora2。在Vidu AI APP,点击二次创作,@一下主体就可以生成一段合拍视频,可以与自己喜欢的角色合拍,也可以基于他人创作的视频进行二创。APP里还内置了海量主体库,以及包括人物、动物、特效等的丰富素材,用户可以直接选用喜欢的主体,随时随地随手生成你想要的视频。不生成也没关系,你大可以像刷视频号或抖音一样刷各类AI视频内容。Vidu AI APP也已经成了集内容创作、互动和分发于一体的平台。

与吴杰茜的对话是在周日(10月26日)下午,她直言没有周末,每天都排满了。她创立的好耶科技(FilmAction)专注于完整剧集的制作,Sora2发布之后,其团队更是一直处于连轴转的状态。

时不我待的紧迫感背后是创业公司的生存焦虑。2023年以来,国内AI视频初创企业超过15家,但随着技术进一步成熟,行业已从技术竞赛转向商业化验证阶段,正在经历快速洗牌,头部效应显著。有不愿具名的业内人士预测,今年会成为存亡分水岭,活下来的不会超过3家。

丨FilmAction支持一键生成完整叙事级短片

不过,对于Sora2带来的这种竞速加剧,吴杰茜认为是行业利好:能给同行带来更多机会,市场足够大,各家企业都能分到蛋糕,关键在于产品力和落地能力。她介绍,FilmAction支持一键生成完整叙事级短片,非专业用户也可以直接产出1分钟含分镜、配音等全流程的高质量视频,已经承接了大量的短剧业务。

行业竞速背后,对超级应用的追逐,不仅是全球科技企业的核心关切之一,也是资本寻找和下注的目标。农雅晴和吴杰茜都认为,AI视频生成领域一定会诞生一个超级应用。吴杰茜还表示,资本近期正在进一步押注国内潜力项目,但并未透露具体名称。

三重隐忧:热赛道的冷思考

当行业沉浸在AI视频的iPhone时刻的狂热中,一些深层问题已悄然浮现。这场技术革命的影响,远比想象中复杂。

首先是技术狂欢下的需求泡沫和技术瓶颈。表面繁荣的数据背后,可能隐藏着伪需求陷阱。某MCN机构负责人透露,用AI生成的带货视频转化率比真人拍摄低30%左右,用户认为画面很炫,但没有真人推荐的可信。这也暴露了当前AI视频在电商场景下的核心矛盾:技术能解决有没有,却难以解决情感连接和信任建立。

丨2024年,快手联合贾樟柯等九位导演发起可灵AI导演共创计划,已推出9部电影短片

而AI生成视频的影视级应用,目前依然处于前期的探索阶段,所谓影视圈抖三抖不过是一种修辞。FilmAction虽然支持一键生成完整叙事级短片,但吴杰茜依然明确表示,AI无法达到完全专业和商业化的水平,只能辅助创作者从0-5的基础部分。同样,尽管快手也已经较早开始了AI影视化尝试,但农雅晴依然谨慎表示:在影视化的规模化落地应用尚不确定。

其次是创意平权与职业替代的阵痛,AI视频生成能力的提升正在消解专业壁垒。过去一条广告需要脚本、分镜、拍摄、剪辑等多工种协作,现在一个人用AI就能完成。这自然使中小创作者获得了前所未有的机会,但也让传统影视从业者面临失业冲击。更令人唏嘘的是,AI催生的新职业可能最先被颠覆。一年前,AI分镜师还被视为AIGC时代馈赠的一个香饽饽,但如今,根据剧本生成分镜几乎已经成为AI视频生成工具的标配。

拟态环境的混乱和认知危机则是AI视频对我们现实信息环境层面的影响。柏拉图的洞穴寓言中,囚徒通过墙上的影子认识世界;如今,AI生成的视频让影子更逼真,却可能更扭曲。当奥特曼偷GPU的视频被大量转发,当AI生成的明星出轨片段在社交媒体疯传,公众的信息甄别能力正面临严峻考验。技术狂奔时,我们是不是也需要问一问:用户真的需要无限逼真的视频吗?可靠、值得信任的信息是不是更难获得?

结语:视频生成的iPhone时刻之后

2022年11月30日,ChatGPT的发布标志着AI从实验室真正走向大众;2025年10月,Sora2的爆发正将视频生成推向类似拐点。但历史告诉我们,技术革命的影响往往需要更长时间显现,就像互联网诞生30年后,我们才真正理解其对社会的全方位重塑。

AI视频生成赛道的火热,本质是科技企业对下一代内容交互范式的争夺。与其说AI视频生成是在制造工具,不如说它是在塑造未来的表达方式。在这场竞赛中,既有技术突破的兴奋,也有泡沫风险的隐忧;既有创作平权的曙光,也有职业替代的阵痛。最终能存活下来的玩家,不仅需要技术实力,更需要对人性的洞察和对责任的敬畏。当AI视频生成真正成为全民表达的工具,其价值将超越商业本身,成为人类创意的放大器。而这一天的到来,需要技术的持续突破,更需要整个社会做好准备:准备好迎接更丰富的创意,也准备好应对更复杂的挑战。

每一次技术狂奔,都是旧世界裂缝里透出的光。AI视频生成把制片厂塞进显卡,让创意平权,也留给我们多重思考。这个赛道会不会真的诞生AI时代的第一个超级应用不重要,重要的是,这是新世界被撕下的第一张糖纸,裹着AI时代真正的命题:

当算法可以模拟一切感官,人类还愿意为什么样的故事买单?

当算力成为基础设施,创意、情感与信任才是最后的稀缺。

火焰还在升腾,有人看见灰烬,有人看见晨星。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。