当前位置：首页 » 资讯 » 新科技 » 正文

Runway重夺全球第一！1247分碾压谷歌Veo3，没有千亿算力也能干翻科技巨头

IP属地中国·北京 新智元 时间：2025-12-02 18:22:51

新智元报道
编辑：定慧
Runway Gen-4.5这波有点厉害！
刚刚更新的Runway Gen-4.5击败谷歌Veo3，重夺AI视频王座！
在Artificial Analysis的榜单中Runway以1247的ELO分数拿下第一。

在观看了RunwayGen-4.5的宣传视频后，被其中的一句话所打动：
我们创造了一个，你可以用来创造一切的的产品。
RunwayGen-4.5此前代号为WhisperThunder。
Gen-4.5采用最先进技术，在视频生成的运动质量、提示词遵循度和视觉保真度方面树立了全新标杆。

以下是一些惊艳的例子。
RunwayGen-4.5在视频模型的预训练数据效率和后训练技术方面均取得显著进步，并成为用于世界建模的新基础模型。
Gen-4.5在ArtificialAnalysis文本转视频排行榜中获得1,247Elo积分，创下新标准并超越了全球所有其他AI视频模型。

Runway是第一家将文生视频技术真正做成可供大众使用的SaaS产品的公司。
在2023年初，Runway率先推出了Gen-1（视频生视频）和Gen-2（文生视频）。
当时谷歌的ImagenVideo和meta的Make-A-Video还停留在实验室演示阶段，而Runway直接让普通用户通过网页就能生成视频。

它是第一个让「AI视频生成」成为独立商业赛道的公司，甚至早于OpenAI的Sora（Sora发布于2024年初）。
Gen-4.5实现了前所未有的物理精确度和视觉精度。
物体以逼真的重量、动量和力量运动。
液体以恰当的动力学特性流动。
表面细节以极高的保真度渲染。
而像发丝和材质编织这样的精细细节在运动和时间内保持连贯。
在复杂场景、精细构图、物理准确性上都表现出色，并且能生成富有表现力的角色。
Gen-4.5能够处理从照片级真实感和电影感，到风格化动画的广泛美学风格，同时保持连贯的视觉语言。
Gen-4.5从初期研发、预训练、后训练到推理的整个开发过程完全基于英伟达GPU完成。
尽管能力有了飞跃，Rnway仍表现出视频生成模型常见的若干限制：
因果推理：效果有时会先于原因出现（例如，门在按下把手之前就打开了）。
物体恒存性：物体可能在帧间意外消失或出现（例如，杯子被遮挡后消失）。
成功偏差：动作异常容易成功（例如，瞄准不佳的射门仍能得分）。

Runway创始人最新访谈
Runway Gen 4.5如何重塑模拟引擎革命？
Runway ML创始人Cristóbal Valenzuela访谈刚刚曝光！

视频模型正从娱乐工具转向世界模拟引擎，这是否预示AGI新时代的曙光？
Cristóbal Valenzuela在 Gen 4.5模型社区投票登顶视频竞技场排行榜后，与Lukas Biewald展开深度对话，剖析视频建模领域的挑战与创新。
视频AI的终局是「世界模拟器」吗？
以小博大：专注与效率的胜利
采访一开始，Lukas就抛出了一个尖锐的问题：「Runway作为一个创业公司，是如何与拥有无限资源的谷歌竞争的？」
Chris的回答非常坦诚。七年前Runway刚成立时，甚至没人觉得「视频模型」是一个值得投入的领域。如今虽然行业已被引爆，且巨头纷纷入局，但Chris认为资源仍然不是决定性因素。

专注(Obsession)：
相比大厂的广泛布局，Runway拥有一支对视频生成愿景极度痴迷的团队。
效率(Efficiency)：
当你没有几千亿美元可以挥霍时，你必须在训练和推理的效率上极度创新。「在有限资源下做到世界第一，迫使我们变得更具创造力。」

二级标题炼丹的玄学：技术中的「品味」
Gen 4.5为什么能大幅领先？Chris提到了一个有趣的词——「品味」(Taste)。
这里的「品味」指的不仅仅是生成画面的美学风格，更多是指「如何训练模型的直觉」。

模型训练没有单一的「魔法按钮」。
它关乎成千上万个参数的微调、无数个Tips&Tricks的组合。
Chris引用了Ilya Sutskever的观点，认为现在是「拥有更大算力的基础研究回归之年」。谁更擅长做基础科学实验，谁就能领先。
超越语言：视频模型即「世界模型」
这是本次采访中最核心的观点。
Chris认为，理解视频模型的最佳方式，是将其视为「通用模拟引擎」(Universal Simulation Engines)。

语言的局限：
语言模型（LLM）受限于语言本身——语言只是人类对现实的一种抽象，而非现实本身。
观察数据的力量：
视频模型通过学习大量的观察数据，能够捕捉到物理世界的规律，如因果关系、空间与时间的连续性、物体恒存性等。

实测案例：Chris举了一个内部测试的prompt例子：「一只袋鼠推着另一只坐在婴儿车里的小袋鼠」。
这不仅需要模型理解复杂的生物运动，还要处理摄像机的跟随运镜。
Gen 4.5能够完美处理这种复杂的物理交互，证明了它不仅仅是在生成像素，而是在理解物理世界。

未来的应用：从电影到机器人
如果视频模型是「模拟引擎」，那它的应用场景将远超现在的影视制作：

非线性娱乐体验：
未来的游戏或互动内容可能不再是预先制作好的，而是实时生成的、可交互的「梦境」。
具身智能(EmbodiedAI)：
有开发者已经开始利用Runway生成合成视频数据，用来训练机器人的手臂操作。
个性化学习：
想象一下，你想学习任何知识，AI都能实时为你生成一段专属的教学视频。

在采访的最后，Chris并没有回避关于安全性的问题。
面对「AI生成内容对儿童限制过多」的抱怨，他表示这确实是一个艰难的平衡，但未来或许会出现类似流媒体平台的「儿童模式」，把控制权交给家长。
Runway的野心从未止步于「视频剪辑工具」。
正如Chris所言，他们正在构建的是一种新的媒介，一种能够模拟万物的智能系统。
我们首先模拟的是娱乐和媒体，但你会看到，这些模型将开始模拟远超于此的一切。
参考资料：
https://runwayml.com/
秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标，锁定新智元极速推送！

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

岚图汽车卢放：智驾不要纠结于数字，整车综合能力才是关键

三一重卡梁林河：纯电动重卡渗透率今年可能突破50%

森林里的“创业绿洲”：张江打造全球数字游民OPC新高地

Linux定了！AI生成代码能用，责任这么算

MiniMax，深夜官宣！

郑丽文现身小米汽车工厂参访，分享体验感受：只有一个字，赞！雷军亲自接见，并赠送郑丽文一部小米手机

全站最新

岚图汽车卢放：智驾不要纠结于数字，整车综合能力才是关键

三一重卡梁林河：纯电动重卡渗透率今年可能突破50%

森林里的“创业绿洲”：张江打造全球数字游民OPC新高地

Linux定了！AI生成代码能用，责任这么算

热门推荐

北大联合智源发布SpikePingpong算法，率先在智元灵犀X2上完成部署

岚图汽车卢放：智驾不要纠结于数字，整车综合能力才是关键

三一重卡梁林河：纯电动重卡渗透率今年可能突破50%

摩尔线程：MTT S5000完成MiniMax M2.7大模型适配

森林里的“创业绿洲”：张江打造全球数字游民OPC新高地

Linux定了！AI生成代码能用，责任这么算

MiniMax，深夜官宣！

股价站上16年来新高诺基亚巨头回归

郑丽文现身小米汽车工厂参访，分享体验感受：只有一个字，赞！雷军亲自接见，并赠送郑丽文一部小米手机

光谷智能传感技术创新研究院揭牌，多家上市公司参与共建

回归商业本质筑牢技术主权：爱芯元智以开放生态定义智驾普惠方案

靳玉志：L3是迈向完全自动驾驶必经之路｜快讯

靳玉志：L3是迈向完全自动驾驶必经之路｜快讯

3月销量出炉，广汽丰田三月三冠

麦肯锡：90%的被调研企业启动AI转型，仅10%实现规模化应用