当前位置：首页 » 资讯 » 新科技 » 正文

智源研究院王仲远：世界模型的关键是真正预测下一个状态

IP属地中国·北京 经济观察报 时间：2025-11-01 20:08:32

经济观察报记者周悦
2025年，“世界模型”（World Model）成为AI领域最受关注的词汇之一。它指的是让AI理解世界运作规律，不再停留在识别或生成层面，而是能想象并预测世界的变化。
随着大模型红利逐渐减弱，各家公司都在寻找新的增长点。DeepMind推出可生成交互式3D世界的Genie 3，OpenAI继续强化 Sora的物理一致性；英伟达、华为、百度等也正从机器人与自动驾驶场景切入，让AI从看懂迈向参与。
10月30日，智源研究院发布悟界·Emu3.5多模态世界大模型。智源研究院院长王仲远在接受经济观察报等媒体采访时表示，随着互联网文本数据被充分利用，大语言模型的增长进入相对缓慢阶段，行业正在寻找新的突破口，而多模态与世界模型正是被寄予厚望的方向。
王仲远认为，Emu3.5很可能开启第三个规模定律范式（Scaling）。在语言预训练和推理优化之后，Emu3.5进一步证明，多模态模型同样具备可规模化成长的潜力。“它的最大贡献，是用自回归架构统一了图像、文本与视频的生成和理解。它能够预测下一个状态（Next-State），这一点非常接近人类大脑对世界进行理解的方式”。
与主流的Diffusion Transformer（DiT）架构不同，智源从“第一性原理”出发，构建原生多模态大模型。在Emu架构下，模型能在同一系统中完成感知、理解、推理与生成，形成一个可持续进化的世界模型。
智源研究院多模态大模型负责人王鑫龙介绍，Emu3.5基于超过10万亿token的多模态数据训练，其中视频数据累计时长达790年，参数规模为340亿。智源团队提出的“离散扩散自适应（DiDA）”推理方法，使图像生成速度提升近20倍，同时保持高质量输出。模型在三个维度上实现突破：一是从意图到规划，能够理解更高层级人类意图，例如，如何制作一艘宇宙飞船，并生成连贯的多步骤行动路径；二是动态世界模拟，能在统一框架内预测物理动态、时空演化与因果关系；三是泛化交互能力，为AI与人类及物理环境之间的协作提供认知基础。
针对外界将世界模型等同于视频生成的看法，王仲远不认同。他认为，世界模型的核心并非视频生成，而是对因果与物理规律的理解。比如机器人要抓起一杯靠近桌边的咖啡，它必须预测哪种动作会让杯子掉下去，哪种才安全——这才是真正的理解。
他认为，人类学习世界时不会区分语言或动作，Emu3.5也不限定用途。它既可支撑具身智能，也能生成多模态训练数据。在他看来，这不仅是一次架构创新，也展示了中国科研团队的原创路线，在世界模型这一尚未收敛的领域中，尝试提出自己的答案。
2024年10月，智源研究院发布了全球首个原生多模态世界模型悟界·Emu3。该模型仅基于“下一个token预测”机制。Emu3.5则在此基础上进一步完善，使AI具备更强的物理直觉与跨场景规划能力。
王仲远认为，未来的AI，不只是理解指令，而要理解世界本身，并在其中行动。
（作者周悦）
免责声明：本文观点仅代表作者本人，供参考、交流，不构成任何建议。

周悦
TMT编辑，关注科技、大健康交叉领域，擅长行业研究，深度报道。“新闻是历史的初稿”。
欢迎联系：zhouyue@eeo.com.cn。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

OpenAI新模型不是GPTX！全新预训练“土豆”曝光

从需求到原型自动生成！传统产品经理升级AI产品架构师的智能化研发工作流

2026年盐城小程序开发供应商盘点：这十家口碑与实力兼具

从宿舍到全球！米哈游3位创始人捐赠母校上海交大设立AI未来基石基金

产品策划最应该掌握的数据分析技能是什么？2026年产品经理数据驱动全攻略

马云曾许诺一位员工，将来可以分红2亿，如今23年过去，兑现了吗

全站最新

OpenAI新模型不是GPTX！全新预训练“土豆”曝光

从需求到原型自动生成！传统产品经理升级AI产品架构师的智能化研发工作流

2026年盐城小程序开发供应商盘点：这十家口碑与实力兼具

从宿舍到全球！米哈游3位创始人捐赠母校上海交大设立AI未来基石基金

热门推荐

小米免费送10万个SU7定制直饮杯：小米之家、小米商城可领

OpenAI新模型不是GPTX！全新预训练“土豆”曝光

从需求到原型自动生成！传统产品经理升级AI产品架构师的智能化研发工作流

2026年盐城小程序开发供应商盘点：这十家口碑与实力兼具

从宿舍到全球！米哈游3位创始人捐赠母校上海交大设立AI未来基石基金

产品策划最应该掌握的数据分析技能是什么？2026年产品经理数据驱动全攻略

马云曾许诺一位员工，将来可以分红2亿，如今23年过去，兑现了吗

大厂围杀，百度搜索大变天，12年功勋老臣赵世奇黯然离职

2026年小程序模板平台优选指南：深度评测对比

热点炸屏！美团京东屏蔽竞品AI大模型，2026大模型发展何去何从？

产品策划最应该掌握的数据分析技能是什么？2026年产品经理数据驱动全攻略

2026文本价值觉醒，赋能智能决策-多模态大模型文本智能白皮书-合合信息

2026年盐城小程序开发供应商盘点：这十家口碑与实力兼具

深度｜对话马斯克：AI将终结资本主义，人类即将迎来全民高收入时代

从需求到原型自动生成！传统产品经理升级AI产品架构师的智能化研发工作流