当前位置: 首页 » 资讯 » 新科技 » 正文

宇树智元机器人在进博会“隔空对话”:王兴兴有困惑,稚晖君有解法

IP属地 中国·北京 上观新闻 时间:2025-11-06 08:09:42



11月5日,第八届虹桥国际经济论坛两场分论坛——“人形机器人创新发展合作”“人工智能产业高质量发展”分论坛,在国家会展中心(上海)的不同会场进行。今年春晚靠扭秧歌出圈的宇树科技、今年营收有望十倍增长的上海智元机器人,两家当下国内最热的机器人创业公司,在进博会主题下,完成了“隔空对话”。

在“人形机器人创新发展合作”分论坛上,宇树科技创始人、董事长王兴兴分享了其最新的行业思考。


宇树科技创始人、董事长王兴兴。

王兴兴笑言,他个人曾乐观估计,今年全中国智能机器人产业平均每家公司增长超过50%—100%,然而行业依旧面临不少需要解决的问题。

“目前人形机器人最关键的还是机器人大模型(具身智能模型)的进展速度。我觉得速度比大家原本想象的要稍微慢一点。”他解释,像机器人研发中一些深度强化学习的全身运控,今年相对去年的进步非常明显,并且在当下的每个月还在飞快进步。 但在机器人大模型领域,技术进步还需要加把劲 。

“我个人比较乐观,我感觉目前的状态就像ChatGPT发布前的几年,大家已经发现了方向,但还没有达到真正做出来的临界点。”王兴兴认为,真正的具身智能“ChatGPT时刻”还没到。如果未来在80%的陌生生活场景中,给机器人发送语音或文字,机器人能完成80%左右的任务,那才算基本达到“ChatGPT时刻”。

他进一步打比方:如果到明年这个时候,随便弄一台人形机器人到一个场景,这个场景它完全没有看过,且完全没有预训练过,给它的东西也没有看到过。此时你跟它说话交代任务,比如说“给这位记者朋友拿一份东西过去”,它自己可以直接过去把任务完成,并且这个场景能达到80%左右的成功率,这就基本达到“ChatGPT时刻”,已经属于非常突破性的技术。

“这是非常重要的目标,如果明年、后年谁能把这个目标实现了,毋庸置疑应该是全球最领先的具身智能AI模型。”王兴兴说。


宇树机器人在今年春晚。

王兴兴还表示,目前行业中的模型和数据方案都还需要改进。简单的模型结构大家已经做了很多尝试,发现泛化能力还不太够,所以模型能力还需要做创新;大家希望数据质量更好一点,规模更大一点,但目前对数据的采集、数据质量的评判还是非常困难的。他坦言,这两部分相辅相成需要花更多时间,而不单单只是一股脑儿去采集大量数据,或者一股脑儿把模型规模做大,这稍微有点盲目了。“我们在模型结构、数据采集方式和质量上需要更多思考,这也是目前全球大家面临比较大的问题。”

而王兴兴的困惑,上海智元机器人也正在全力攻克。

在“人工智能产业高质量发展”分论坛上,智元机器人合伙人、高级副总裁姚卯青介绍了智元在机器人本体、数据、模型、场景上的全栈布局。这四者形成了相互驱动的飞轮迭代逻辑——优质本体产生高质量数据,海量高质量数据支撑算法持续突破,算法结合场景试错后,又为本体优化、数据采集方向、算法迭代等提供新的指引。

年轻的智元有令人惊讶的速度——2023年2月才成立,由“天才少年”彭志辉(B站上是拥有百万粉丝的UP主“稚晖君”)担任联合创始人,迄今已发布全系列多款机器人产品,建成规模化生产产线和机器人训练场数据采集中心,在具身智能相关算法领域也已实现多项创新。


彭志辉与情商在线的灵犀X2。

姚卯青坦言,智元机器人进入“飞轮循环”的首个挑战就是数据。“机器人从业者”需直面与物理世界的强交互特性,其数据需求与互联网数据存在本质差异,尤其是大量动作类、长程规划类数据极为稀缺。“面对具身智能数据的荒漠,智元选择种下一棵树,愿其能成为一片森林。”姚卯青说,智元于2024年底开源了AgiBot World百万真机数据集,每条数据都经过多轮审核,确保场景贴近现实、任务复杂多样,旨在提供工业级高质量数据支撑。


智元的具身数据采集厂。(李晔 摄)

但AgiBot World数据集只是起点,智元在数据采集方式上有两项关键创新,包括“对抗式采集数据”,即在常规数据采集过程中主动引入干扰,以此提升数据信息密度;针对机器人在真实环境中自主执行任务时难以提前枚举的“长尾失效”问题,智元又引入“自主进化式采集方案”,将“难场景”下的高价值数据补充到训练集。

今年3月,智元发布其具身智能基座模型GO-1模型,并在生活、零售、工业三大场景的评测中表现亮眼。

除GO-1外,智元还在深耕世界模型方向。所谓世界模型,类似于真正的人类大脑,通过学习现实世界中的物理和因果规律,具备“物理直觉”,可在内部模拟环境变化,基于当前环境状态推演未来状态,并评估自身行为的后果。智元秉持“生成理解一体化”理念,其世界模型GenieEnvisioner今年8月正式开源,并打出“行业首个面向双臂真机的世界模型”概念。官方演示里,基于世界模型,机器人连续完成做三明治、倒茶、擦桌、用微波炉、装箱等长链条任务,看上去已颇具“人味儿”。

就在上月,智元机器人举行线上直播发布会上,发布新一代工业级交互式具身作业机器人智元精灵G2。在AI技术支撑上,精灵G2正是基于智元全栈自研的通用基座大模型GO-1与世界模型GE-1,其复杂任务处理能力显著提升。如柔性制造中,用具身智能解决专业设备无法应对的高精度、力控、泛化性操作问题;在物流分拣上,具身智能通用机器人与专用设备配合,处理传统视觉定位+规划难以完成的杂乱物品分拣等。据悉,智元精灵G2已获数亿元订单,即将开启首批商用交付。

原标题:《宇树智元机器人在进博会“隔空对话”:王兴兴有困惑,稚晖君有解法》

本文作者:解放日报 李晔 张杨

责任编辑:王凤枝_NT2541

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。