当前位置: 首页 » 资讯 » 新科技 » 正文

银河通用张直政最新发声:仿真合成数据将具身智能训练效率提升千倍

IP属地 中国·北京 财闻 时间:2025-09-12 18:21:51

在以“重塑创新增长”为主题的“2025 Inclusion·外滩大会”上,共有40余家具身智能企业亮相。如何协同产业链上下游,将技术突破转化为商业回报,成为不少与会行业人员关注的问题。

“我们的愿景是把具身智能大模型所带来的智能和高性能人形硬件本体结合起来,形成一个完整的产品力服务,让它真正能够实现跨行业应用、走进千家万户、服务千行百业。”9月12日,在“具身智能:从泛化到行动,重塑产业未来”的分论坛上,北京银河通用机器人有限公司(以下简称“银河通用”)联合创始人、大模型负责人张直政分享了团队在具身智能训练方面正在探索的途径和方向。

一个聪明的、会干活的机器人是通过场景训练出来的。在人形机器人迎来爆发的关键阶段,不少企业要面临“具身智能训练的数据从哪里来”的问题。


“具身智能:从泛化到行动,重塑产业未来”分论坛

张直政在现场演讲中介绍,目前行业内已经有通过真机遥操作采集数据。他以特斯拉举例介绍称,在训练电池分拣任务上,需要数十万条数据,40个人要花费一个月时间进行采集。“如果按国内的人力成本来算,我们可能要花数百万人民币。”

在张直政看来,如此耗时耗力的数据采集方式是否会是通往具身智能的最终解决路径值得思考,尤其是当具身智能面临跨任务泛化时,可能需要上万亿条数据。

从2023年创立到现在,银河通用机器人坚持探索的技术路线则是用仿真合成数据。据了解,仿真合成数据具有可控性、效率高,但在文理和语义的学习上比不上真实场景的数据。

张直政表示,目前这个问题已经被图文大模型、数字大模型解决了,现在可以用更多的互联网数据让机器人学语义。银河通用目前在探索的便是,机器人学习动作用仿真数据,学习语义可以部分结合真实数据。

“从前端的各种形态、各种功能数据资产的生成,到动作轨迹的生成,再到最终的渲染,我们实现了一条完整的高效的仿真合成数据的管线。有了这样的管线,我们就可以更快速、更低成本生产更高质量的动作数据来训练我们的具身模型。”张直政讲述称。

据他介绍,银河通用已经生产出世界上目前规模最大的数据集——10亿级别的仿真合成数据,目前内部已经进一步将数量级扩大至百亿级别、千亿级别。

“有了大规模仿真合成数据,我们就能够做到通过预训练让模型在视觉、语言、动作层面实现不同维度的泛化。”张直政提到,这将直接实现效率上的提高,“同样是做电池分拣任务,一个遥操员可能只要花半天不到的时间就能够让具身智能完成技能的学习。”

“通过少量真实数据后训练,可以1000倍提升真实数据效率。”张直政表示,未来还可以打开想象,当学习更多技能时,效率提升可能是上万倍甚至是数十万倍。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。