当前位置: 首页 » 资讯 » 新科技 » 正文

宇树科技开源UnifoLM-VLA-0模型,可单一策略完成12类复杂操作任务

IP属地 中国·北京 澎湃新闻 时间:2026-01-29 22:48:13

1月29日,宇树科技开源其面向通用人形机器人操作的VLA大模型UnifoLM-VLA-0。

据介绍,针对操作类任务中对指令理解与空间感知的高要求,模型通过继续预训练深度融合了文本指令与2D/3D空间细节,增强了模型的空间感知能力。同时,模型构建了全链路动力学预测数据,模型具备更好的任务泛化性。

基于Qwen2.5-VL-7B开源模型,宇树构建了覆盖机器人与通用场景的多任务数据集,并开展持续预训练。针对操作类任务,团队还对开源数据集进行了系统化清洗,最终仅用约340小时的真机数据,进行离散动作的预测训练。

宇树表示,经由仿真环境与真机实验的多任务训练验证,结果显示该模型具备单模型处理多任务的通用能力,在LIBERO仿真基准测试中,多任务模型取得了接近最优的性能。在真机验证中,仅需单一策略即可高质量完成12类复杂的操作任务。(澎湃新闻记者 秦盛)


免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新