当前位置：首页 » 资讯 » 新科技 » 正文

腾讯混元开源首个面向世界模型的强化学习后训练框架WorldCompass

IP属地中国·北京 编辑：孙雅 IT之家 时间：2026-03-10 16:12:13

IT之家 3 月 10 日消息，腾讯混元 3D 团队今日宣布开源业界首个面向世界模型的强化学习后训练框架 WorldCompass，这是此前发布的混元世界模型 1.5 官方强化学习扩展模块，能够让世界模型的交互更加准确，体验更好。
WorldCompass 是一个专为长时序、交互式世界模型设计的强化学习（RL）后训练框架。如果说世界模型是引擎，那么 WorldCompass 就是“指南针”，通过引入强化学习机制，直接“引导”模型如何更准确地遵循用户指令探索世界，并保持长时序的视觉一致性。
实验表明，WorldCompass 能提升 SOTA 开源世界模型（WorldPlay）的交互准确率和视觉保真度，特别是在复杂的组合动作场景下，交互准确率提升了近 35%。
团队在最新的开源 SOTA 模型 WorldPlay 上进行了验证。结果显示，经过 WorldCompass 的后训练，模型能力实现了大幅提升。
在最为困难的复合动作（Combined Action）场景下（例如同时进行移动和旋转）：基座模型对于复杂组合式动作序列执行的准确率仅为 20% 左右。使用 WorldCompass 训练后，准确率提升至 55% 左右，提升幅度超过 35%。对于基础动作，准确率也提升了约 10%。
同时，在斯坦福大学世界模型 Benchmark WorldScore 上，WorldCompass 取得了更好的评分：

标签：模型开源世界混元 准确率 面向世界 腾讯动作视觉框架时序业界 保真度 场景序列基础 一致性 用户指令模块官方团队引擎 斯坦福大学 消息能力基座

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

雷诺集团发布全新战略futuREady，到2030年计划推出36款新车型

Jeff Dean新访谈：未来开发者人均50个智能体，写需求成核心技能

周鸿祎警示：养龙虾暗藏风险 AI幻觉或致C盘文件全被删

AI价值深度释放：京东2025收入超1.3万亿，多元业务稳步增长

米家儿童电动牙刷Pro众测：彩屏动画互动引导，刷2分钟有正向激励

银昕推出三模PCIe HBA控制卡ECS08，采用PCIe Gen3×8接口

全站最新

雷诺集团发布全新战略futuREady，到2030年计划推出36款新车型

Jeff Dean新访谈：未来开发者人均50个智能体，写需求成核心技能

周鸿祎警示：养龙虾暗藏风险 AI幻觉或致C盘文件全被删

AI价值深度释放：京东2025收入超1.3万亿，多元业务稳步增长

热门推荐

消息称特斯拉延迟AI6芯片在三星2nm的多项目晶圆(MPW)测试

安卓17迈步桌面化：借鉴ChromeOS将限制USB4接口直接访问内存

雷诺集团发布全新战略futuREady，到2030年计划推出36款新车型

Jeff Dean新访谈：未来开发者人均50个智能体，写需求成核心技能

周鸿祎警示：养龙虾暗藏风险 AI幻觉或致C盘文件全被删

AI价值深度释放：京东2025收入超1.3万亿，多元业务稳步增长

两会民声｜机遇还是挑战？当AI进入寻常百姓家

养虾血泪史: 比“养不起”更怕的是数据“裸奔”

“第一个吃龙虾的人”，也可能是小白鼠 | 封面评论

米家儿童电动牙刷Pro众测：彩屏动画互动引导，刷2分钟有正向激励

银昕推出三模PCIe HBA控制卡ECS08，采用PCIe Gen3×8接口

如何破解低空飞行器里程焦虑？单晓明：不能靠造一款万能电池

【为你喝彩】韩秉烨：以科研匠心铺就“长寿”路

AI+核技术赋能实体企业与民生幸福的价值分析

朱朝阳掌舵河南苏宁：提速AI革新抢抓焕新“开门红”