当前位置: 首页 » 资讯 » 新科技 » 正文

让机器人在现实世界“越用越聪明”,智元机器人发布SOP模型

IP属地 中国·北京 文汇报 时间:2026-01-06 20:17:13


今天,智元机器人具身研究中心发布一项突破性技术——一套面向真实世界部署的在线后训练系统SOP(Scalable online Post-training)。这是业界首次在物理世界的VLA后训练中,系统性地融合在线学习、分布式架构与多任务通才性,使机器人集群能够在真实环境中持续进化,让个体经验在群体中高效复用,从而将“规模”转化为“智能”。

当前,通用机器人迈向大规模真实世界运行面临一个核心矛盾:既要在开放环境中保持稳定可靠,又需应对千差万别的任务。尽管现有VLA预训练模型(即视觉-语言-动作模型)给机器人提供了通用能力,但其“离线、单机、串行”的后训练模式,存在数据采集效率低、任务专精度不足等瓶颈,难以支撑高效、持续的真实世界学习。

如果说VLA让机器人第一次具备了通用理解与行动能力,那么SOP所做的,是让众多机器人的经验共同驱动智能的快速成长。它重构了机器人的学习范式,将其从封闭的实验室训练,转向开放的“实战练兵”。

该系统的核心在于构建一个“在线、集群、并行”的学习闭环:多台机器人在不同地点同时执行多样任务,实时将成功与失败的经验数据上传至一个云端模型;该云端模型持续在线学习,并定期将参数同步回每一台机器人,实现集体能力的即时跃升。


SOP架构设计

实验结果有力验证了SOP的价值。在商超整理、叠衣服、纸盒装配等多样化测试场景中,结合SOP的训练方法带来了显著性能提升。例如,在物品繁杂的商超场景中,系统实现了33%的综合性能提升;在叠衣服任务中,操作吞吐量跃升了114%。SOP让多任务通才的性能普遍提升至近乎完美,不同任务的成功率均提升至94%以上,纸盒装配更是达到98%的成功率。


结合SOP的训练方法在多样化测试场景中给机器人带来了显著性能提升。

经SOP训练后的模型,在长达36小时的连续运行中展现出卓越的稳定性和鲁棒性,能够有效应对真实世界中出现的各种疑难杂症。尤为重要的是,当机器人被部署到全新陌生环境时,SOP能在数小时内使其性能快速回升至高效稳健水平。

“SOP改变的不仅是训练范式,更是机器人系统的生命周期。”智元机器人表示,机器人不应是“性能固定的标品”,而应成为“在真实世界中持续提升的生命体”,部署不是终点,而是智能化规模进化的起点。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。