具身智能领域正迎来前所未有的发展热潮,中国行业领军企业宇树科技上市进程稳步推进,而中美科技巨头则在这一赛道展开更为深度的战略布局。
在GTC 2025主题演讲中,英伟达CEO黄仁勋展示了挪威1X公司研发的NEO Gamma人形机器人。这款产品采用基于英伟达GR00T N1模型的后训练策略,能够自主完成物品整理任务。黄仁勋强调,人形机器人的核心竞争力在于环境适应性和持续学习能力,其"大脑"的智能化水平直接决定产品性能。
这一观点很快得到市场验证。2025年8月,英伟达推出革命性产品Jetson AGX Thor边缘计算平台,被业界誉为"新一代机器人大脑"。该平台基于Blackwell GPU架构,峰值算力达2070 FP4 TFLOPS,AI性能较前代产品提升7.5倍,能效优化3.5倍。其最大突破在于实现单模块实时感知决策,使机器人摆脱对云端计算和多芯片架构的依赖。
亚马逊仓储机器人和波士顿动力等企业已率先将Thor集成至产品体系。该平台不仅硬件性能领先,更通过与Isaac机器人软件平台的深度整合,构建起完整的生态壁垒。其搭载的Isaac GR00T N1模型采用双系统架构,其中"快速思考行动模型"负责即时反应,"慢思考模型"则进行环境推理和路径规划。1X公司CEO Bernt Børnich证实,借助GR00T N1模型,NEO Gamma仅用少量后训练数据就完成全功能部署。
在地球另一端,字节跳动正以独特路径切入机器人赛道。2025年7月,该公司推出通用机器人模型GR-3,其搭载的ByteMini机器人成功完成衣架悬挂、家居用品整理等复杂任务。技术分析显示,GR-3通过混合训练方法实现强适应性:先进行大规模图像文本预训练,再通过虚拟现实环境微调,最终学习真实机器人动作。这种训练策略使GR-3能准确理解"左侧椅子""较大盘子"等抽象指令。
AI科学家Chris Paxton的研究表明,字节40亿参数的GR-3模型在复杂环境适应性方面优于英伟达20亿参数的GR00T系列。这印证了"规模定律"在机器人领域的有效性——随着数据量和算力的提升,模型性能将持续突破。
字节的研发步伐并未停歇。2025年9月,Seed团队发布Robix模型,专注机器人任务规划、自然语言交互等核心功能。研究员董恒透露,该模型集推理、规划与交互能力于一体,性能超越GPT-4o和Gemini 2.5 Pro。但Robix需与GR-3等VLA模型配合使用,前者负责决策规划,后者执行具体动作,这种分工模式与英伟达的双系统架构形成有趣呼应。
在官方测试中,搭载GR-3控制器的Robix系统完成餐桌清理、收银装袋等任务,仅在饮料筛选环节略逊于Gemini 2.5 Pro。这种技术路线折射出字节的战略布局:通过GR-3和Robix的协同,构建完整的"机器人大脑"解决方案。
追溯字节的机器人发展史,其技术积累始于2020年。2023年12月推出的GR-1模型采用视频生成式预训练模式,2024年的GR-2则使用3800万段视频数据进行训练,在100余个操控任务中取得97.7%的平均成功率。目前,字节已量产超千台轮式物流机器人,服务于抖音电商仓及顺丰、比亚迪等客户,这些产品具备自主路径规划和任务执行能力。
人才储备方面,字节Seed团队规模预计突破300人,并在招聘网站发布"下一代通用机器人"相关岗位。产业投资层面,其关联基金锦秋基金参与宇树科技C轮融资,显示字节通过资本运作完善机器人生态布局。
面对中国市场的战略价值,英伟达已与联影医疗、万集科技、优必选等7家国内企业展开Thor平台合作。在2025年CES展上,黄仁勋与14家人形机器人企业同台,其中6家来自中国。宇树科技CEO王兴兴评价,Thor平台显著提升了机器人的敏捷性和自主决策能力。
值得关注的是,字节尚未出现在英伟达的Thor合作名单中。但考虑到双方长期的技术合作基础,以及黄仁勋对中国具身智能市场的重视,未来两家科技巨头的深度协作仍存在想象空间。随着字节推出22自由度、球形腕设计的ByteMini机器人,其打造下一代具身智能产品的野心已显露无遗。