刚刚进入12月,视频生成模型的竞赛又开始了。当地时间12月1日,海外AI视频初创公司Runway正式发布新一代视频模型Gen-4.5,在基准测试中超越谷歌的Veo3登顶。
就在Runway发布后的1小时,国内视频生成选手可灵AI也在海外X平台上宣布,全新视频模型可灵O1上线,这款模型被定义为“首个统一多模态视频大模型”。两家公司同一时间发布新品,火药味很浓。
![]()
目前在基准测试Artificial Analysis的榜单上还没有可灵O1,但Gen-4.5早在发布前就用“Whisper Thunder (aka) David”这一名字出现在测试中,经过匿名票选成为当前文生视频的最佳模型。
根据Artificial Analysis的榜单,目前Gen-4.5以1247的评分拿下文生视频的第一名,紧随其后的是谷歌的Veo3,分数为1226,9月发布的快手可灵2.5排在第三位,分数为1225,与谷歌Veo3仅一分之差。OpenAI的Sora2 pro排在第7位,MiniMax的海螺02排在第8位。
![]()
官方表示正在逐步开放Gen-4.5的使用权限,未来几天内所有用户都能体验到。并且“加量不加价”,会以和当前订阅套餐相近的价格全面开放。
最新发布的Gen-4.5强在哪?Runway介绍,Gen-4.5将视频生成的前沿推向更远,在预训练数据效率和后训练技术方面都取得了突破。该模型也擅长理解和执行复杂的序列指令,用户一条指令,即可指定详细的镜头调度、精巧的场景构图、精确的事件时间安排以及微妙的氛围变化。
从画面来看,模型在精确的提示词遵循能力、逼真的物理运动效果以及风格控制和视觉一致性等方面有了新的进展。
![]()
真实的物理规律一直是AI视频生成难点,Runway表示,Gen-4.5实现了前所未有的物理精度和视觉精度。在生成的画面中,物体以真实的重量、动力移动,而液体以适当的动力学流动,表面细节渲染也非常逼真。如头发和材料编织这样的细节在运动和时间中能保持一致。
但AI生成的“真实”往往暗藏瑕疵。例如,在官方给出的案例中,一只鹦鹉站在西瓜、仙人掌、花盆、菜篮组成的“支架”上,随着鹦鹉的移动,西瓜像不倒翁一样晃动,而鹦鹉时而振翅时而停留,无论是动态还是物理规律来看都很真实。
![]()
但放在真实世界中,这一物理结构的受力是否合理,在经过晃动后是否仍能保持形态存在疑问。
在博客中,Runway也承认,尽管能力有了显著提升,但模型仍存在一些局限性,例如因果推理和对象恒存性方面有不足,效果有时会先于原因出现,物体有可能在意外消失或出现。Runway表示为了进一步推进世界模型,必须解决这些缺陷。
作为一家初创公司,Runway的视频模型能超越谷歌确实是一个值得肯定的进展。在接受媒体采访时,Runway CEO Cristóbal Valenzuela表示,“我们仅靠一百人的团队,就击败了万亿美元规模的公司。只要极度专注、勤奋,就能触及技术前沿。”
Runway成立于2018年,根据PitchBook数据,目前公司估值已达到 35.5亿美元。2023年2月,Runway发布了第一代视频模型Gen-1,并在7 月的Gen-2 中实现了文生视频和图生视频的功能,在行业中布局较早。
从2024年开始,AI视频生成领域的竞争就逐渐白热化,Runway的地位受到威胁。尤其在2025年,谷歌的Veo系列逐渐确定了其行业领先地位,留给初创公司的生存空间越来越少,而国内如快手可灵、MiniMax的海螺也在行业形成一定竞争力,对于Runway来说,在这时通过产品确立新的地位显得尤为重要,其新一轮融资也还在推进中。
Gen-4.5能在榜首保持多久是未知数,可灵O1发布后或许是其有力的竞争对手,而行业也在期待谷歌下一代视频模型Veo4的发布,这场围绕视频生成模型王座的较量还会持续一段时间。





京公网安备 11011402013531号