当前位置: 首页 » 资讯 » 科技探索 » 正文

智元机器人双突破:EVAC框架与EWMBench评测基准同步开源

IP属地 中国·北京 编辑:陆辰风 珠江网 时间:2025-07-10 19:01:54

在具身智能研发面临真机验证成本高、数据利用率低等挑战的背景下,智元机器人于近日宣布开源两项重要成果:基于动作序列驱动的具身世界模型EVAC(EnerVerse-AC)和具身世界模型评测基准EWMBench。这一突破性进展标志着具身智能研究进入"算法-评测"协同进化的新阶段。

智元机器人依托技术积累,在去年的世界模型架构EnerVerse基础上,推出EVAC与EWMBench。其中,EVAC是全球首个基于机器人动作序列驱动的世界模型,能动态复现机器人与环境的复杂交互,实现从传统仿真到生成式模拟的跃迁。其基于EnerVerse架构演进,创新引入多级动作条件注入机制,实现“物理动作-视觉动态”端到端生成。核心能力包括:机器人动作与像素高精度对齐,精准建模多种复杂动力学行为;动态多视图建模,支持多视角协同生成一致视觉场景;具备卓越的长时序一致性,保证模拟过程连贯真实;融合相关数据集及失败轨迹提升生成质量,抑制幻觉现象。

在价值上,EVAC实现生成式仿真评估与数据引擎双轮驱动。生成式仿真评测可与待评测策略模型交替推理,构建交互式评测管线,评测结果与真机评测成功率高度一致,提升策略模型筛选效率;数据增广引擎能基于少量专家轨迹数据大规模增广数据,经其训练的策略模型任务成功率提升高达29%。

为科学衡量具身世界模型性能,智元机器人推出全球首个具身世界模型评测基准EWMBench,填补行业空白,构建统一可信的评测标准。其构建“场景×动作×语义”的三维度评估体系,从场景一致性、动作合理性与语义对齐与多样性进行考核。场景一致性采用微调的DINOv2特征量化;动作合理性利用三重互补指标评估;语义对齐与多样性结合多模态大模型和CLIP评估。

EWMBench基于开源百万真机数据集构建,涵盖多场景、多任务及多种交互对象,含300多个测试样本及30%挑战性场景,还同步开源全流程评测工具,且在评测结果与人类主观判断一致性上优于主流视频生成评测基准VBench。EnerVerse为EVAC提供基础框架与预训练能力,EVAC生成的数据反哺EnerVerse优化,形成“训练-验证”闭环,EWMBench助力精准定位EVAC不足。二者组合方案入选相关赛事官方基线系统与评测标准,为开发者提供实践平台。

EVAC和具身世界模型评测基准EWMBench的发布与开源,旨在构建“低成本模拟-标准化评测-高效迭代” 的全新开发范式,赋能全球具身智能研究,加速技术落地与产业发展。未来,智元机器人将持续深化前沿开源实践,引领具身智能向更高效、普适的未来演进。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新