当前位置：首页 » 资讯 » 新科技 » 正文

从Sora2到蒸汽机2：被引爆的AI视频全球竞速

IP属地中国·北京 编辑：孙雅翼言商业观察 时间：2025-11-03 11:55:57

“AI视频生成领域，一定会诞生一个超级应用。”
翼言商业观察
10月以来，AI视频生成领域卷出了新高度。
上周，发布Vidu Q2图生视频不到2周，Vidu10月21日再次更新：参考生、时长最多可延长至五分钟、APP从AI创作平台转变为一站式AI内容社交平台。
生数科技的紧迫感并非孤例。上上周，10月15日，百度视频生成模型蒸汽机再次升级这已经是其7月 2日上线以来的第三次重大升级。
这两场密集发布背后，是10月1日OpenAI扔下的那颗炸弹。当天，Sora 2及其社交应用上线，凭借生成技术的突破和社交化的创新玩法，首周下载量超ChatGPT同期，OpenAI CEO山姆奥特曼偷GPU被抓与李小龙对打等内容席卷全网。
全球巨头的应激反应迅速展开。10月8日，埃隆马斯克xAI推出Imagine v0.9，以20秒快速生成、全用户免费发起反击；10月16日，谷歌发布Veo 3.1，强调物理引擎精准度，其Fast版本生成速度提升3倍。国内战场更显激烈：从百度蒸汽机到快手可灵，再到生数科技和好耶科技（FilmAction），都是国庆中秋8天无休的状态，快手研究院农雅晴直言：这个行业本来就很卷，节假日加班并不意外。
这场席卷全球的AI视频生成军备竞赛，早已超越单纯的技术比拼。从硅谷创业公司到中国互联网大厂，从OpenAI到谷歌，从百度、可灵到好耶、生数，近百亿美元资本与数千名工程师的投入，折射出科技产业对下一代内容交互革命的集体押注。喧嚣背后，技术突破与商业泡沫、创作平权与职业替代、创新红利与伦理风险的博弈，正将这个赛道推向更复杂的十字路口。
现象级爆发：Sora2点燃了火药桶
在Sora2最初放出的视频中，篮球投偏后反弹落地、花滑选手头顶一只猫完成三周半跳、雨滴落地后溅起，甚至多物体复杂场景的运动，都能精准模拟物理世界的运行规律。此外，Sora 2实现了原生音画同步，支持多语言对白与环境音效对齐，角色也能在多镜头中保持一致。这种接近影视级的生成效果，再次拉高了行业参照系。
丨Sora2生成的山姆奥特曼偷GPU
更具突破性的是其社交玩法：用户上传一张自拍照，输入在月球上跳舞，Sora 2就能生成10秒高复刻度的用户在月球跳舞的视频，还能通过Remix功能让好友加入共舞。山姆奥特曼的个人肖像权开放，网友脑洞大开的玩梗创作进一步放大了出圈效应。这种即时创作+社交裂变的模式，使Sora 2在邀请制下仍5天内登顶美国App Store免费榜，下载量突破1000万次，远超ChatGPT初期增速。
这场爆发并非偶然。
技术层面，无论是对物理世界的模拟精度还是音画同步、叙事和运镜能力，Sora 2显然都有了明显的提升。而它从视频生成工具升级为基于视频生成的社交化产品，更是为其出圈加了一把烈火。
对此，好耶科技创始人吴杰茜认为，当AI视频生成的技术提高、门槛降低之后，大众的视频化社交需求一定会被进一步激发，Sora 2的出圈显然说明，这是一个经过验证的产品方向。更重要的是，这极大提高了AI视频生成的大众关注度和认知度，给相关企业带来更多的市场机会。
当前，AI视频生成已经在电商、广告、短视频等多个领域开始落地，甚至参与影视制作：Netflix在2023年就发布了首部AIGC动画短片《犬与少年》；2024年，快手联合李少红、贾樟柯等九位知名导演开启了可灵AI导演共创计划，推出了9部AIGC电影短片；今年4月，新加坡上映了全球首部院线公映的AI电影《海上女王郑一嫂》，长达70分钟，成本尚不及传统方式的1/10。当制作商业视频的成本指数级下降，需求的爆发就顺理成章。
据Fortune Business Insights数据，2024年全球AI视频生成市场规模已达6.15亿美元，2025年将达到7.17亿美元，预计2032年将增至25.63亿美元，年复合增长率达20%。中金更为乐观，认为仅中期来看，创作者和B端生产力工具市场规模就有望突破100亿美元。
全球竞速：科技巨头的生存焦虑与创业公司的生死时速
Sora2的发布和出圈，瞬间激活了全球科技公司的神经。马斯克推出Imagine v0.9，主打电影级运镜，支持一镜到底生成；谷歌发布Veo 3.1和Veo3.1Fast，前者强调物理引擎精准度，后者则将生成速度提升3倍。
在国内，无论是科技大厂还是初创公司，这种竞速也在上演。与谷歌同日，百度10月15日发布蒸汽机升级版，支持无限时长生成和实时交互；生数科技10月21日推出Vidu Q2，首次上线视频延长功能，最长扩展至5分钟，其生成演技技术能精准控制人物微表情，确保同一角色在不同场景中的一致性。
丨百度蒸汽机在行业内首次实现AI长视频实时交互生成
值得一提的是，百度蒸汽机团队采用自回归扩散模型，并结合流式滑窗架构，在行业内首次实现了AI长视频实时交互生成：在生成过程中，用户可实时交互，随时改写内容或扩写续集，这意味着 AI 视频生成从开盲盒一次性输出进入动态创作流阶段。
丨Vidu Q2首页，玩法对标Sora2
Vidu 更是在社交玩法上直接对标Sora2。在Vidu AI APP，点击二次创作，@一下主体就可以生成一段合拍视频，可以与自己喜欢的角色合拍，也可以基于他人创作的视频进行二创。APP里还内置了海量主体库，以及包括人物、动物、特效等的丰富素材，用户可以直接选用喜欢的主体，随时随地随手生成你想要的视频。不生成也没关系，你大可以像刷视频号或抖音一样刷各类AI视频内容。Vidu AI APP也已经成了集内容创作、互动和分发于一体的平台。
与吴杰茜的对话是在周日（10月26日）下午，她直言没有周末，每天都排满了。她创立的好耶科技（FilmAction）专注于完整剧集的制作，Sora2发布之后，其团队更是一直处于连轴转的状态。
时不我待的紧迫感背后是创业公司的生存焦虑。2023年以来，国内AI视频初创企业超过15家，但随着技术进一步成熟，行业已从技术竞赛转向商业化验证阶段，正在经历快速洗牌，头部效应显著。有不愿具名的业内人士预测，今年会成为存亡分水岭，活下来的不会超过3家。
丨FilmAction支持一键生成完整叙事级短片
不过，对于Sora2带来的这种竞速加剧，吴杰茜认为是行业利好：能给同行带来更多机会，市场足够大，各家企业都能分到蛋糕，关键在于产品力和落地能力。她介绍，FilmAction支持一键生成完整叙事级短片，非专业用户也可以直接产出1分钟含分镜、配音等全流程的高质量视频，已经承接了大量的短剧业务。
行业竞速背后，对超级应用的追逐，不仅是全球科技企业的核心关切之一，也是资本寻找和下注的目标。农雅晴和吴杰茜都认为，AI视频生成领域一定会诞生一个超级应用。吴杰茜还表示，资本近期正在进一步押注国内潜力项目，但并未透露具体名称。
三重隐忧：热赛道的冷思考
当行业沉浸在AI视频的iPhone时刻的狂热中，一些深层问题已悄然浮现。这场技术革命的影响，远比想象中复杂。
首先是技术狂欢下的需求泡沫和技术瓶颈。表面繁荣的数据背后，可能隐藏着伪需求陷阱。某MCN机构负责人透露，用AI生成的带货视频转化率比真人拍摄低30%左右，用户认为画面很炫，但没有真人推荐的可信。这也暴露了当前AI视频在电商场景下的核心矛盾：技术能解决有没有，却难以解决情感连接和信任建立。
丨2024年，快手联合贾樟柯等九位导演发起可灵AI导演共创计划，已推出9部电影短片
而AI生成视频的影视级应用，目前依然处于前期的探索阶段，所谓影视圈抖三抖不过是一种修辞。FilmAction虽然支持一键生成完整叙事级短片，但吴杰茜依然明确表示，AI无法达到完全专业和商业化的水平，只能辅助创作者从0-5的基础部分。同样，尽管快手也已经较早开始了AI影视化尝试，但农雅晴依然谨慎表示：在影视化的规模化落地应用尚不确定。
其次是创意平权与职业替代的阵痛，AI视频生成能力的提升正在消解专业壁垒。过去一条广告需要脚本、分镜、拍摄、剪辑等多工种协作，现在一个人用AI就能完成。这自然使中小创作者获得了前所未有的机会，但也让传统影视从业者面临失业冲击。更令人唏嘘的是，AI催生的新职业可能最先被颠覆。一年前，AI分镜师还被视为AIGC时代馈赠的一个香饽饽，但如今，根据剧本生成分镜几乎已经成为AI视频生成工具的标配。
拟态环境的混乱和认知危机则是AI视频对我们现实信息环境层面的影响。柏拉图的洞穴寓言中，囚徒通过墙上的影子认识世界；如今，AI生成的视频让影子更逼真，却可能更扭曲。当奥特曼偷GPU的视频被大量转发，当AI生成的明星出轨片段在社交媒体疯传，公众的信息甄别能力正面临严峻考验。技术狂奔时，我们是不是也需要问一问：用户真的需要无限逼真的视频吗？可靠、值得信任的信息是不是更难获得？
结语：视频生成的iPhone时刻之后
2022年11月30日，ChatGPT的发布标志着AI从实验室真正走向大众；2025年10月，Sora2的爆发正将视频生成推向类似拐点。但历史告诉我们，技术革命的影响往往需要更长时间显现，就像互联网诞生30年后，我们才真正理解其对社会的全方位重塑。
AI视频生成赛道的火热，本质是科技企业对下一代内容交互范式的争夺。与其说AI视频生成是在制造工具，不如说它是在塑造未来的表达方式。在这场竞赛中，既有技术突破的兴奋，也有泡沫风险的隐忧；既有创作平权的曙光，也有职业替代的阵痛。最终能存活下来的玩家，不仅需要技术实力，更需要对人性的洞察和对责任的敬畏。当AI视频生成真正成为全民表达的工具，其价值将超越商业本身，成为人类创意的放大器。而这一天的到来，需要技术的持续突破，更需要整个社会做好准备：准备好迎接更丰富的创意，也准备好应对更复杂的挑战。
每一次技术狂奔，都是旧世界裂缝里透出的光。AI视频生成把制片厂塞进显卡，让创意平权，也留给我们多重思考。这个赛道会不会真的诞生AI时代的第一个超级应用不重要，重要的是，这是新世界被撕下的第一张糖纸，裹着AI时代真正的命题：
当算法可以模拟一切感官，人类还愿意为什么样的故事买单？
当算力成为基础设施，创意、情感与信任才是最后的稀缺。
火焰还在升腾，有人看见灰烬，有人看见晨星。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

四季度重大项目“竞速” 成都冲刺“十四五”高质量发展收官战｜成都发展

未来竞速丨百年汽车工业大变局，读懂它，这一本书就够了！

豆包，正在成为「新字节」

推理专用芯片，火了

一个人，运营一家跨境公司，我用阿里这款AI智能体实现了

华为近8亿元增资人形机器人赛道

全站最新

四季度重大项目“竞速” 成都冲刺“十四五”高质量发展收官战｜成都发展

未来竞速丨百年汽车工业大变局，读懂它，这一本书就够了！

豆包，正在成为「新字节」

推理专用芯片，火了

热门推荐

四季度重大项目“竞速” 成都冲刺“十四五”高质量发展收官战｜成都发展

未来竞速丨百年汽车工业大变局，读懂它，这一本书就够了！

国家能源局：优化充电基础设施服务效能推动大功率充电设施规划建设

从何小鹏蹲求电池到曾毓群率队破冰，小鹏与宁王为何“攻守易形”？

豆包，正在成为「新字节」

推理专用芯片，火了

一个人，运营一家跨境公司，我用阿里这款AI智能体实现了

华为近8亿元增资人形机器人赛道

理想汽车全年64万辆目标仅完成56%

零跑要与巨头分天下

国家能源局：加快构建高质量充电基础设施体系

Meta Quest头显获推v83更新，大幅提升头显追踪手部效果

天津基地圆满完成第50发运载火箭发射任务

国家能源局：推动大功率充电设施规划建设

“非完全人形”机器人正在攻入家庭场景