当前位置: 首页 » 资讯 » 科技探索 » 正文

人形机器人要开100家药店、进餐厅打工,王兴兴、王鹤等剧透机器人进展

IP属地 北京 编辑:赵云飞 大力财经 时间:2025-06-06 21:31:42

智东西

作者 | 许丽思

编辑 | 漠影

6月6日报道,今天,2025智源大会在北京中关村展示中心开幕。

活动现场,来自宇树、银河通用、北京人形机器人创新中心、灵初智能、穹彻智能等多家机器人公司的人形机器人、轮式机器人、双臂机器人等带来了丰富的技能展示,比如餐饮互动,机器人接受到语音指令后,完成汉堡制作和倒饮料的动作,以及抓娃娃的游戏和家居物品收纳。

在大会的具身智能主题圆桌环节,宇树科技CEO,北京人形机器人创新中心总经理熊友军,北京大学助理教授、智源具身智能研究中心主任、银河通用创始人兼CTO王鹤,穹彻智能联合创始人、上海交通大学教授、上海创智学院副院长卢策吾以及Physical Intelligence联合创始人兼 CEOKarol Housman,针对具身智能技术发展、产业落地等话题各抒己见。

王鹤聚焦产业化,介绍其机器人已进驻多家药店,今年将在北上深开设100家由人形机器人24小时值守的无人药店;而卢策吾提到,穹彻智能的机器人已批量进入多个食品加工处理行业,做麻辣烫、冰淇淋等,机器人通过力反馈解决复杂场景接触问题。 王兴兴称,公司从造四足机器人到人形机器人,是顺其自然,但不执着于人形,未来AGI时代机器人形态可能达当前上百倍;熊友军指出具身智能赛事是知识普及盛会、技术训练场,还能搭建产业桥梁,其天宫2.0通过软硬件升级,可在工厂等危险环境作业。 Karol Housman 称,Physical Intelligence的机器人仅需100个家庭数据即可泛化至新环境,当前最大瓶颈是算法而非数据,需改进算法提升复杂任务成功率。 一、银河通用王鹤:具身智能需以推动产业化为目标,今年要开设百家机器人药店

借助VLA技术,银河通用打造了更适用于商超货架场景的机器人。王鹤现场演示了基于自研的端到端大模型的Galbot机器人在接受到人类指令后,依次从密集的货架上拿取对应物品的场景。

王鹤介绍,与传统的基于轨迹生成的方式不同,银河通用的模型能够应对货架上琳琅满目的各种货品,无论是瓶装、袋装,还是薯片或果冻等不同形态的商品。该模型是闭环的,在机器人拿取物品的过程中,即使认为干扰,它也会继续抓取。另外,银河通用的技术特点在于训练数据主要采用合成数据,成本低廉且易于扩增。

在当下谈论具身智能时,需要以推动其产业化为目标。王鹤称,尽管现在能看到了许多炫酷机器人的技能,但仍需反思这些技能在新环境、新物品以及用户要求成功率接近100%的情况下是否能够成功应用。这也是银河通用和智源的联合团队在开展工作时的思考重点,聚焦于如何先打通一些关键技能,主要是移动抓取和放置技能。

王鹤觉得,如果能让人形机器人在超市、工厂料库区或外卖前置仓等场景中实现24小时服务,这将是具身智能真正走向产业化,开始服务人民并创造生产力的开端。

值得一提的是,如今银河通用的人形机器人已在北京进驻7家无人药店,24小时由人形机器人完成药品捡取并对接骑手的派送工作。无人药店为夜间急需用药的患者提供了便利,也避免了雇佣人员24小时值守的困扰。今年年底,银河通用计划在北京、上海、深圳共开设100家这样的药店。

相信在将来,人们在超市下单或车厂配料等场景中,人形机器人将成为工作主角。王鹤也期待,后续能够在机器人的操作能力上与一些赛事进行对接,以赛事引领有价值、可落地技能的形成,不断推动生态发展。

二、穹彻智能卢策吾:端到端模型需寻找更多方法减少不确定性

去年,穹彻智能推出穹彻大脑V1版本,即将在7月份发布V2版本,其中体现了对现实世界的物理理解与交互能力。力反馈在这里起到了关键作用,因为在进行许多动作时,人们往往都是下意识地进行操作。对于经济价值较高的复杂动态接触和操作场景,力反馈尤为重要。

例如刮胡子,这个动作需要机器人在抓取后保持稳定,并持续不断地接触,力度过大或过小都会影响效果,这就需要极高的鲁棒性来模仿人类的下意识行为。

卢策吾介绍,穹彻智能早已将这一技术应用于实际商业场景,在食品加工处理行业实现了批量化落地,比如制作麻辣烫、刮冰淇淋等场景需要精确的力控。食品加工涉及高密度或高持续的接触,对物理理解的难度较大,每一毫秒都要精确反馈动作,其机器人能像人的手感一样完成任务。如今,可能大家所食用的某些食品背后已经有穹彻智能的机器人参与生产了。

另外,他也提到,将机器人的应用拓展到生活场景也是十分必要的,比如照顾人、擦拭脸部等与人交互的生活场景,穹彻智能的模型融合了力和位置反馈,是全球唯一拥有此功能的大模型。

针对VLA模型,卢策吾谈道,它确实很火,本质上涵盖了机器人需要完成的任务,即通过视觉理解世界(V),利用语言与人类沟通(L),并借助行动改变世界(A)。语言作为粘合剂,能够将各种高层语义通过数据连接在一起,具有很好的扩展性,但也存在局限性,需要持续推进。

如果想要实现通用智能,面临的挑战将比无人车复杂得多。无人车的决策维度较少,且场景相对固定,而通用智能需要处理的空间更大,不确定性也更多。因此,在端到端模型中,需要找到更多方法来减少不确定性,例如穹彻智能一直致力于利用力反馈,它能够提高稳定性,减少鲁棒性问题。

卢策吾介绍,在即将发布的穹彻大脑第二版中,穹彻智能加入了数字基因等新元素,通过产生大量仿真数据资产,进而优化试验模型。

三、宇树科技王兴兴:团队并不执着于人形机器人,未来机器人形态种类可能会是目前上百倍

王兴兴展示了宇树去年研发的人形机器人G1,现场演示了其拳击的能力。从春晚的集群表演到格斗比赛,宇树希望通过这些活动向公众呈现当前全球人体机器人技术的发展现状,推动整个机器人行业不断向前发展。

在王兴兴看来,现阶段的机器人可能还难以直接进入家庭或工厂承担实际的工作任务,这是全球机器人领域共同面临的挑战。但宇树始终抱有期望,希望机器人能够真正地去干活,并且目前已经取得了一些技术成果,在此基础上,宇树努力尝试进行更多的商业化拓展。他相信,机器人格斗在未来几年将会成为一项风靡全球的体育赛事。

过去几年,王兴兴在参加各类活动时多次公开表达过,公司并不执着于一定要做人形机器人。对于员工而言,从研发四足机器狗到研发人形机器人,是比较顺理成章的选择。特别是对于腿部设计,采用轮子、底盘等方式其实会更为实用。

然而,当下大家更倾向于人形设计,尤其是保留上半身的人类形态,这主要是因为目前的AI大多基于人类的数据采集来进行训练,上半身保持与人类动作一致,有助于更便捷地采集数据,进而方便AI的训练。若考虑到全身设计,在跳舞、格斗比赛等活动,如果机器人不是人形的话,就很难完成这些任务。

王兴兴提到,在AGI或真正的通用AI出现之后,机器人的形态将会变得极为丰富多样,无论是工厂里的大型机器人,还是医疗等领域的机器人,其种类将会比现在多出许多倍,甚至可能是上百倍。但在当下,由于AI主要依赖数据驱动,人形机器人在训练和落地应用方面仍具有较大的优势。

四、北京人形机器人创新中心熊友军:具身智能赛事是知识普及的盛会,也是技术的训练场

熊友军展现了北京人形机器人创新中心最新研发的天宫2.0,这是一个开源开放的平台,在天宫1.0的基础上进行了更新升级。天宫1.0曾在半程马拉松比赛中取得了优异的成绩,用时一小时四十分钟跑完全程,被证明是最能跑的机器人。而天宫 2.0则在上肢部分进行了更多升级,增加了自由度,加装了灵巧手,提升了负重能力。现场展示了天宫2.0在进行水果摆盘的过程。

熊友军介绍,北京人形机器人创新中心自去年4月升级为国家地方共建人形机器人创新中心,此次升级是一个体系化能力的提升,主要体现在以下四个方面: 首先是硬件平台的升级,此前主打机器人的场地适应能力,使其能够在草地、沙地、丘陵、石子等各种路型地面运行,而现在侧重于让机器人能够在工厂以及各种危险环境里代替人完成任务。 其次是软件方面,今年3月份,创新中心发布了首个通用具身智能体“开物”平台,这是一个一脑多机、一脑多人的平台,包含具身智能的大脑和小脑。 熊友军提到,创新中心还围绕具身智能体的训练构建了国内大型的数据采集和机器人训练中心,打造了20多个虚实结合的数据采集场景平台。最后,为了保障机器人的稳定可靠性,创新中心还牵头在北京建设了针对人形机器人的测试平台。

关于天宫1.0曾经夺冠的人形机器人马拉松赛事,熊友军觉得,这样的具身智能比赛意义重大,尤其是即将在北京鸟巢举办的具身智能运动会。其意义主要体现在三个方面:

一是作为具身智能知识普及的盛会,通过比赛让大众全面了解机器人的发展现状和技术水平,像鸟巢的比赛涵盖了田径、足球、舞蹈等多种大众喜闻乐见的项目,能让人们在观看过程中潜移默化地学习到机器人知识,提升科技素养。

二是作为具身智能技术的训练场,比赛场景来源于真实生活场景,包括工厂的物流搬运、医院的医药分拣和送药、酒店服务等场景,这些场景为企业和商业场景所提出,符合机器人发展方向,有助于提升机器人技术。

三是搭建了机器人潜在客户与企业沟通的桥梁,有望推动机器人产业化的加速以及在真实场景中的试点应用。

五、Karol Housman:机器人无需过多数据集就可实现泛化,真正挑战在于算法

Housman介绍,长期以来,大家都认为很难让机器人进入一个完全陌生的环境并发挥实际作用,因此团队选择了家庭环境作为测试场景。

家庭环境是终极挑战,因为每个家庭都各不相同,如果机器人能够进入一个它从未见过的家庭并完成任务,对团队而言是检验其泛化能力的最高标准。相比于工厂这些相似度比较高的环境,家庭环境更加多样化,这使得这一挑战更具价值。

在开始这个项目时,团队面临的一个关键问题是,机器人需要接触多少样的数据,才能全新的家庭环境中实现泛化?结果发现,只需要一百个不同的家庭数据,机器人就能在第一百零一个家庭中实现泛化。

尽管它并非每次都成功,失败的情况仍然存在,但这一成果表明了一个良好的趋势:可能不需要海量数据,机器人也无需接触极端多样化的数据集,即可实现真正的泛化。团队的研发仍处于起步阶段,但这是一个极其有希望的信号,也是此前未曾预料到的。

Housman谈道,目前仍存在一些瓶颈,其中最突出的是模型的成功率尚未达到实际需求。这不仅仅是数据收集的问题,还需要算法上的改进。即使拥有无限的数据,仅凭现有算法也无法在复杂、长程的精细任务中达到100%的成功率,这需要新技术来解决,团队正在努力攻克这一方向。

几个月前,Housman曾认为具身智能最大的瓶颈在于泛化能力,但基于π 0.5的成果,他相信团队已掌握了优化泛化能力的方法,答案主要来自数据。但关于性能问题,他觉得这更多是算法问题,而非数据问题。

结语:机器人正加速融入人类生活

无论是对机器人形态的多样化探索,还是在技术瓶颈上的攻坚克难,亦或是推动机器人产业化的不懈努力,都让我们看到了机器人技术的蓬勃生机与无限潜力。

机器人产业化的探索正从场景验证迈向规模复制,赛场、工厂、门店、商场等的落地,意味着具身智能商业化初期正在逐步开启。机器人正逐步加速融入人类生活的方方面面,也将在未来扮演更加重要的角色,为产业与社会的发展注入源源不断的动力。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。