当前位置: 首页 » 资讯 » 新科技 » 正文

Efficiency Law, 物理精确世界模型,及世界模型驱动的学习新范式

IP属地 中国·北京 机器之心Pro 时间:2025-10-27 16:18:44




机器之心发布

机器之心编辑部

2025 年秋装智能工作室正被分会活动:特斯拉上海超级工厂宣布 Optimus 2.0 量产下线,同步开放开发者平台提供运动控制与环境采集 SDK,尝试通过生态共建破解数据孤岛难题;英伟达则在 SIGGRAPH 大会上推出物理 AI 全栈方案,其 全宇宙 平台结合 Cosmos 世界模型可生成高质量合成数据,直指真机数据的痛点。

这些热点事件共同指向行业共识:曾被算法创新忽视的数据问题,才是智能落地的根本问题解决。

针对这个问题,近日,我们与跨维智能创始人、香港中文大学(深圳)教授贾奎,香港中文大学(深圳)副教授、工具身决策实验室主任刘桂良进行了一场深度对话与探讨,试图找到突破工具身智能学习枷锁的关键。



什么是 效率定律 ?

其与 缩放定律 有何区别?

1. 缩放定律 在身体智能领域带来了什么挑战呢?

贾奎:标度律 是大语言模型发展过程中所观察到的经验法则,即模型的性能与数据量、模型容量/参数量、算力之间分别有一个幂函数关系,此经验法则有助于在给定的资源条件下,指导如何存在最优模型性能为目标的数据、模型与算力分配。

效应的有效性是建立在训练大语言模型所需要的海量文本数据存在的前提下的,但对于训练具身智能模型来说,如上所说,领域还没有建立能够支撑标度律的数据范式,那么效应本身也无法发挥指导作用。

具身智能的发展需要能够自身当前阶段有更好指导意义的新决策,因此在中,我们基于缩放定律推导出新的适用当前具身智能发展的新决策,命名为 效率定律。

也就是说,我们首先定义一个名为“数据生成速率”的量 r_D,在最大允许的模型生产时长的条件下,模型性能与 r_D 存在一个幂函数关系,并受控于一个模型容量的幂函数与一个 r_D 的幂函数的加和,进一步启动,在有限时间内,更高的 r_D 能显着提升学习效率,从而通过训练大容量模型提升实际性能,而过低的 r_D 会导致模型进入“数据稀缺区”,使规律故障。

通俗解释,效率定律的核心观点是:在有限的高效时间内,具身模型性能上限的,是生成高质量数据的速率(我们称为r_D)。数据生成速率越快,可以越快地“吃饱”一个大模型,从而突破性能瓶颈。如果速度太慢,模型就会一直处于‘吃不饱’的‘数据稀缺区’,再大的潜力也发挥不出来。所以,具身智能的重点必须从‘堆数据’转向’造数据’。

因此,车身智能的发展必须从“采数据”和“堆数据”转向“高效地造数据”;通过提高高质量数据的生成与利用效率,建立起支撑车身智能发展的新学习范式。

为什么世界模型需要绝对的物理精确性?

2. 当前基于视频生成的世界模型,有什么不足之处?

贾奎:当前基于视频生成的世界模型虽然能够生成视觉上连贯、动态一致的视频序列,但它们主要在像素维度进行统计学习,追求的是“新颖”而不是“物理正确” 。

此类模型往往缺乏对真实规律的理解,无法准确模拟如摩擦、质量、受力、流动等简单的动力学机制,其生成结果更多依赖于训练数据的分配因果关系计算,因此在分配外模型时很容易产生违反物理逻辑常识的反事实场景。

对于具身智能而言,学习的核心在于建立真实世界中的感知、动作、反馈循环,智能体必须遵循牛顿力学等物理法则来实现的行为。因此,具身智能所依赖的世界模型必须具备物理精确性,能够针对刚体、软体、流动等显着式三维表征,根据动力学、运动学原理预测世界状态变化计算系统的内部状态,推理被现实或未达到的元素变化,保持过程中的一致性,并支持世界状态的存储与恢复,以实现精确的仿真与规划。唯有如此,世界模型才能为具身智能提供符合真实物理约束的环境基础,支撑其在世界中的后续学习与决策。



3. 您可以阐述一下“基于生成式仿真的世界模型”的内涵、原理和基本属性,它能如何解决视频世界模型的不足之处?



刘其桂良:我们在提出了基于生成式仿真的世界模型,即生成式仿真世界模型(GS-World)。它是一种将生成模型与物理仿真引擎深度融合的新型世界模型,从根本上改变了“世界生成”的机制。

传统基于视频生成的世界模型主要在像素层学习数据分配,追求上的动态性,却无法保证物理规律的正确性;而 GS-World 则在生成过程中显式或隐式地引入物理仿真,将生成模型与可微分的物理仿真相结合,使世界的动态趋向真实的力学等方程。

它不仅生成场景的外观,还同时生成三维资产、实物、物理参数与交互规则,从源头保证运动、碰撞、受力等现象的因果合理性。由于内部状态可被显着式计算与逆向传播,GS-World 能够支持智能体在仿真环境中真实地行动、学习与验证既具有可控性又具备物理精度,从而解决了模型依赖数据分布规划、无法视频泛化和反事实拓扑的传播。

由此看来,GS-World 真正把“看起来像真实世界”变成了“遵循物理规律可计算的世界”,为具身智能提供了可信赖的学习与推理基础。



4. “基于生成式仿真的世界模型”,有什么潜在用途?

贾奎:我们所提出的GS-World具有极高的潜在应用价值,它不仅仅是一种新的技术形态,更代表着“世界模型”的终极方向。

首先,GS-World 能够在物理上精准建模和预测世界动态,真实地生成三维环境、物体属性及其物理交互规律,从而解决了 Sora2 等视频生成模型仅具拟真、多样化物理一致性的问题。在这种框架下,视频生成只是一个“自然产物副”,系统可通过任何视角的可微输出渲染视频,而其本质是一个能够内在计算蕴含完整物理因果过程的引擎。

其次,GS-World 也是强化学习领域中长期追求的“基于模型 的强化学习的终极模型”,它能够在仿真空间内构建世界动力学并进行高保真策略验证,实现虚拟试错与策略优化的闭环学习。

同时,有了 GS-World,VLA模型的学习将变得极为便利:系统消耗昂贵的真实机器人数据采集可以通过仿真世界自动生成多模态训练数据,并在物理精确的环境中实现策略验证与校准。

从根本上来说,GS-World 能够作为一个通用智能引擎(Engine),驱动持续、流式的身体智能学习,使其能够自动生成、仿真、评估和逆向优化整个学习过程,使智能体在不断变化的虚拟物理世界中学习与发展,从而发展出“引擎驱动的身体智能”这一全新的学习范式。

以世界模型为引擎,装备智能学习新范式

5. 您可以介绍一下“基于生成式仿真的世界模型”为引擎,如何构建新的装备身智能学习模式?

贾奎:GS-World推出了全新的“发动机驱动工具身智能学习范式”。

相比当前基于任务开发的Sim2Real路径或Real2Sim2Real等变种,GS-World 能够主动生成并仿真物理精确的三维世界,使智能体在其中操作、行动、试错与学习,形成“生成—交互—反馈—优化”的闭环。

它不仅让世界具备计算器可计算性与自行建立能力,还使智能体的策略学习、任务构建与环境生成融资消耗,从而实现流式、进化的具身智能训练体系。

这种引擎驱动(引擎驱动)的 Sim2Real VLA 范式,使智能体真正能在生成并物理自洽的世界中持续成长,为通用具智能体的自主学习式奠定了核心引擎基础。



6. 这种范式如何实现效率法, 它还有什么其他好的属性?

刘桂良:GS-World是实现效率法的核心机制。

首先,GS-World 将“世界生成、物理仿真、任务构建、反馈优化”整合为一个可微分、可自进化的统一引擎,使智能体的训练过程由被动的数据驱动转向主动的任务生成与环境相结合。这样,世界与智能体共同构成一个自激励、自循环的学习系统,智能增长速度将与生成仿真能力成正比,体现出学习高效随数据生成速度(r_D)的 效率规律。

其次,GS-World 通过可控生成能力构建无限多样的物理环境与任务空间,使智能体能够在统一的世界模型框架下同时学习多任务、多模态、多物理规律的行为,从而实现“通才化(通才)”的认知扩展。同时,引擎还具备精细化的分配调节能力,可针对特定任务、技能或物理机制自动学习空间、聚焦优化,形成“专才化(专才)”的学习结构。

也就是说,GS-World 提供了一个既能横向扩展的智能广度、又能纵向精化智能深度的动态引擎,使装置主体智能能够在高效率、强自适应和持续性的闭环中不断生长。

这种具备自动化、可扩展与弹性特征的引擎机制,为未来的设备智能建立了一个真正可自组织、自安装的学习生态。



7. 您可以展开描述“数据驱动”与“引擎驱动”的智能学习工具,范式上有什么本质上的不同?

刘桂良:数据驱动的主体智能学习以外部数据为中心,智能体从过去的经验分布中提取规律,缺乏对物理世界的显着式建模,因此学习定义、扩展性差、缺乏因果一致性。

而引擎驱动的设备本体智能学习则以生成式仿真引擎(GS-World)为核心,让智能体在一个可生成、可启动、可验证的世界中自主学习,通过闭环交互持续生成数据、构建因果模型并优化策略。它不依赖外部数据供给,而依靠自身生成能力驱动智能持续增长,实现学习效率、泛化能力和可解释性的全面跃升。

从数据驱动到引擎驱动,是装备智能从“修改现实”走向“生成现实”的根本范式转变。



8. 为什么要实现产品级成功率和鲁棒抗干扰性的工具身智能,世界模型引擎驱动的学习范式是必然选项?

贾奎:在家庭、商业和工业等复杂的真实场景中,机器人只有在具备物理精确性、抗环境干扰能力及泛化安全性的前提下,才能实现产品级的稳定性与成功率。

传统数据驱动方法只能从表象数据中学习统计相关性、缺乏与现实物理一致的因果约束,从而在遇到干扰或未见场景时性能崩溃。

而基于 GS-World 的引擎驱动学习范式,能够从根本上构建物理一致的可生成世界,让智能体在仿真中经历无限真实的交互与试错过程,自主习得对复杂力学、噪声和变化的补偿策略,从而自然获得鲁棒性、泛化力与安全性。

这意味着:要实现真正可部署、可靠且可信赖的设备本体智能产品,引擎驱动的世界模型学习已不是一个可选方向,而是必然的技术路径。

世界模型发动机:

装备身智能机器人的终极训练场和配备场

9. 机器人的技能是如何在“基于生成式仿真的世界模型”中产生和训练的?

刘桂良:在 GS-World 中,机器人技能不再是人类手工设计的任务脚本,而是通过引擎生成的物理世界中自然“挖掘”出来的。

该模型通过生成真实物理交互的世界,使技能在仿真中形成多样性、交互优化与验证阶梯形成;通过多模态表示与动作机制语法,这些技能得以抽象、组合与迁移,具有可扩展性的技能生态。最终,凭借世界模型的物理准确性与仿真鲁棒性,以及引擎的连续域随机和域适应能力,这些在虚拟世界中学习的技能能够安全而高保真地迁移至现实环境,从现实世界到学习再到迁移现实的闭环。

这意味着,在 GS-World 引擎中,技能成为装备身智能内在的、可解释、可扩展、可复用的智能基础元,是未来通用机器人能力的核心生成机制。



10. 如何理解“基于生成式仿真的世界模型”是具身智能机器人的安装场?

贾奎:GS-World 同步是具身智能机器人的接通场,依靠它让智能体的身体结构、控制策略与环境动力学在同一物理生成机制下共同构成。

GS ‑ World 通过可微分的物理仿真、图结构的形态表示及仿生搜索,使机器人能够在虚拟机制但物理一致的世界中不断探索自身形态、优化行为并积累经验。

它提供的不仅仅是训练环境,而是一个能促使机器人实现身体与智能行为体的 关键跃迁平台,从而实现人工智能定义机器人本体。

结语

AGI、物理AGI 与装备智能正全面完成高速发展的阶段,行业提出一种基于期待第一性原理、能与具体任务场景深度且契合具备高性能的新技术范式。

而跨维智能联合香港中文大学(深圳)提出的GS-World 世界模型引擎,以及基于该引擎的工具身智能学习新范式,就是这一范式的典型代表。

目前,GS-World 引擎原型以及基于其自动训练的VLA 模型也将于近期开源。期待更多产业及学术研究人员投入到这一潜力的新方向,共同推进智能产业的快速发展和广泛落地。

参考文献

Jared Kaplan 、Sam McCandlish、Tom Henighan、Tom B. Brown、Benjamin Chess、Rewon Child、Scott Gray、Ale C Radford、Jeffrey Wu 和 Dario Amodei。神经语言模型的缩放定律。arXiv 预印本 arXiv:2001.08361,2020 年。

Jordan Hoffmann、Sebastian Borgeaud、Arthur Mensch、Elena Buchatskaya、Trevor Cai、Eliza Rutherford、Diego de Las Casas、Lisa Anne Hendricks、Johannes Welbl、Aidan Clark、Tom Hennigan、Eric Noland、Katie Millican、George van den Driessche、Bogdan Damoc、Aurelia Guy、Simon Osindero、Karen Simonyan、Erich Elsen、Jack W. Rae、Oriol Vinyals 和 Laurent Sifre。《训练计算优化的大型语言模型》。arXiv 预印本 arXiv:2203.15556,2022 年。

刘桂良,邓月慈,刘震,贾奎,GS-World:一种基于生成模拟世界模型的引擎驱动学习范式,公开评审,2025。

NVIDIA, Alisson Azzolini, Hannah Brandon, Prithvijit Chattopadhyay, Huayu Chen 等. Cosmos-reason1: 从物理常识到具身推理. arXiv preprint arXiv:2503.15558, 2025.

OpenAI.Sora:从文本创建视频,2024年。

Saman Motamed、Laura Culp、Kevin Swersky、Priyank Jaini 和 Robert Geirhos. 生成视频模型是否理解物理原理?arXiv 预印本 arXiv:2501.09038,2025 年。

David Ha 和 Jurgen Schmidhuber. 世界模型. CoRR, abs/1803.10122, 2018.

Yann LeCun. 迈向自主机器智能之路. Open Review, 2022.

张凯燕,齐必清,周博文. 构建融合系统1和系统2的专用通才人工智能. arXiv预印本arXiv:2205.11487, 2024.

Luca Carlone 和 Carlo Pinciroli,《机器人协同设计:超越单调案例》,IEEE 机器人与自动化国际会议(ICRA),第 3024 – 3030 页,2019 年。

文中视频链接:https://mp.weixin.qq.com/s/-N86ismeNuaZxrbSZy2kpg

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。