调制鸡尾酒、搬运零件箱、中医手法按摩……在7月26日至29日举行的2025年世界人工智能大会(WAIC 2025)现场,各家的机器人纷纷进行“才艺展示”。
具身智能作为今年大会的重点展示区域之一,引发了参展观众的极高热情。在大会的H3展厅,可以看到不少观众排队与各类机器人进行互动,智元机器人、宇树科技等高人气展台更是被围得水泄不通。
宇数G1格斗机器人的擂台赛节目引发大量观众围观。观察者网
据主办方透露,今年大会的前沿展品包括60余款智能机器人,有超150台人形机器人同台“出道”,这也是国内人形机器人有史以来最大规模的亮相。
相较于往年大会中机器人企业在性能方面的“秀肌肉”,具身机器人的各类落地应用场景的展示成为了本届大会的一大亮点,从“实验室”走向“应用场”,机器人的落地应用图景正在展开。
从调酒师到搬运工,人形机器人大放异彩
如何将具身机器人应用在民生服务领域,是不少企业正在探索的新方向。在本次大会上,擎朗智能延续“为服务而生”的设计理念,带来了新款双足人形服务机器人XMAN-F1,并展示了医疗和餐饮两大具体应用场景。
在展台上,XMAN化身成了不同岗位的服务人员与观众互动。作为调酒师,XMAN可以准确识别观众的订单内容,并精准模拟服务人员动作逻辑与姿态,完成识别酒瓶、倾倒冰块与混合酒水饮料的动作。作为小卖部经理和药房助手时,它也能给客户铲上一桶爆米花,或完成药品的挑选分拣工作。
擎朗机器人XMAN-F1在WAIC中央展区首秀 擎朗智能
擎朗机器人XMAN-R1在自主展区为观众手铲爆米花、调制鸡尾酒。 观察者网
据擎朗工作人员介绍,擎朗推出XMAN系列人形服务机器人,旨在与其它形态的机器人进行协同,通过将餐饮、医疗等商业服务场景拆解为独立的工作模块,对应具有明确工作边界和职责范围的单一标准化岗位,建立“机器人-岗位”的精准对应关系,在商业环境形成机器人能力的闭环。
例如,在餐厅中,XMAN可以独立完成取酒、倒酒、放置托盘等配餐动作,并通过机器间任务调度,将餐品交接给专门的配送机器人按最优路径送餐,并在最后完成桌面清理任务。
擎朗工作人员表示,未来擎朗将根据不同商业需求提供量身定制的多形态具身服务机器人解决方案,以岗位化分配任务环节,以应对服务场景内的更多需求。
银河通用在本次展会则带来了当家产品Galbot,展现了在零售、工业、物流等多维领域的落地场景。
在企业自主展区,银河通用搭建了1:1还原的真实商超场景,由Galbot进行全天候值守,在自主推理、零遥操的情况下为观众从货架上精准取送商品。
现场工作人员介绍,Galbot能稳定完成复杂任务的核心是背后的端到端具身大模型GroceryVLA。该模型突破传统“视觉+轨迹规划”分离设计,能够在几乎无空隙、货架紧密且SKU众多的真实场景中自主识别商品并稳定抓取,无需路径规划即可灵活高效操作,标志着端到端大模型驱动的闭环控制已具备商用能力。
据了解,所谓端到端的VLA模型,指的是视觉-语言-动作模型,可模拟人类“看—想—动”的连续过程,直接将大脑信号转化为机器人动作,拥有更高的场景推理能力与泛化能力。这一前沿领域正吸引全球科技公司加大投入与迭代。
银河通用Galbot正把从货架上抓取的饮料递给观众。 观察者网
此外,在工业、物流料箱转运作业中,Galbot能完全依靠视觉感知,自主识别箱体位置与形态,并智能规划搬运动作。它能灵活地先用一只手拉开堆叠间隙,再用双手协同搬运,展现出高度自主的动作规划与执行能力。据悉,在与极氪汽车工厂的合作中,Galbot的搬箱效率已达到与人类工人相当的水平。
在工业领域的汽车零件分拣工作中,Galbot也展现了精准识别和抓取目标工件,分辨近似零件,避免误抓等功能,在深筐作业时实现了自主避障,完成智能化操作。即使面对人为捣乱,如调换工件筐位置或故意弄乱工件,Galbot依然能够快速定位正确工件,实现灵活应对和自我校正。
银河通用Galbot展示在工业场景中搬运货箱、零件分拣等工作。观察者网
“一脑多形”变成现实,具身智能内涵丰富
除了人形具身机器人以外,多种非完全人形的机器人也在本次展会亮相,体现了“一脑多形”的通用具身大脑正从想象变为现实。这些形态各异的机器人,通过共享先进的VLA具身智能模型,同样能实现高效、精准的作业。
在非夕科技的展台,不少观众体验了机器人中医按摩服务。据介绍,这套机器人按摩设备与数采系统相结合,依托自适应机器人遥操作应用,可精准采集指柔、指拨、掌揉等专业按摩手法数据,打通按摩手法从“经验表达”到“数据驱动”的路径,实现“人类技艺”向“机器现实”的无缝迁移,为后续模型训练和智能复现提供具身数据基础。
现场工作人员表示,该系统解决了重要的按摩数据前端来源问题,能够满足医生的诊疗需求,不少医院的客户在体验过后对此非常满意,目前一套机械臂设备的价格在24万元左右,将在今年9月落地第一个项目。
“机械臂的应用场景其实非常广泛,通过广泛的数据采集和模型训练后,未来可以形成一个标准化的平台,不只可以应用于医疗,也可以用于危化品处理、军工等各个行业。”非夕工作人员说道。
现场观众正在体验非夕科技的机械臂按摩。 观察者网
在WAIC的中央展区,非夕的双臂机器人则给观众们串起了关东煮串串,可在观众挑选关东煮种类后智能识别原料种类,实现自动抓取、智能穿串、精准加热及柔性交付。
据悉,这套“具身智能+食品工业”示范系统由智能食品加工方案供应商希夕智能联合非夕、穹彻共同开发,集智能识别、灵巧操作与人机交互于一体。
非夕双臂机器人正在进行串关东煮工作。 观察者网
就在非夕关东煮摊位的隔壁,云百生的手术机器人正在一丝不苟地剥着鹌鹑蛋的蛋壳,并实现将蛋壳碎片完整取下,而内层蛋膜毫发无伤,引来观众们的纷纷赞叹。
现场工作人员表示,在告诉机器人需要剥哪块蛋壳后,机器人可自主逐块完成剥取工作,AI视觉系统能够自动分析出蛋壳的变形以及破碎情况,再不断更新剥取方案。
据介绍,这台由云百生研发的全自主机器人,能实现微米级精度的操作,可辅助医生完成高难度手术操作,极大降低手术难度。
云百生机器人正在完成鹌鹑蛋壳剥取工作。观察者网
大模型深度赋能,“大脑与小脑”得到进化
各类型机器人在不同应用场景之所以能发光发热,得益于大模型的深度赋能。目前,大模型技术已全面进入机器人的“大脑”(决策)和“小脑”(控制)。如何开发适用于不同落地场景的大模型,或成为接下来具身机器人发展的重点方向。
在“WAIC里技能大舞台”的智造车间区域,国地中心研发的“青龙”机器人正身着工作服,有序地进行自动化物料分拣作业。它的核心正是基于600万真机数据和VLA预训练,形成的2.8B操作大模型。
国地中心研发的“青龙”机器人正在进行物料分拣作业。 观察者网
上核管孔清理机器人也在该展区亮相,该机器人由上海电气中央研究院与国地中心联合研发,它可以在管板直径达5米,两万多个管孔中完成清洁工作,高效解决了劳动工人长时间弯腰重复作业的问题。
现场工作人员介绍,面向此类人形机器人高精度双手协同作业场景,上海电气中央研究院与国地中心联合攻关,攻克了具身数据标准化采集、精密视觉定位技术、灵巧操作与抓取技术、多模态感知与柔顺控制技术等难题。
上核管孔清理机器人正在演示核电装备管板孔的清理操作。 观察者网
据悉,国地中心和浦江实验室团队预计年底前将完成2500万整机数据积累,规模达谷歌同类数据集的10倍。通过扩大数据规模,显著提升了机器人的泛化能力和涌现能力,使其能够基本满足核电、汽车、3C等复杂工业场景的作业要求。
在本次展会上,灵初智能则着重展示了在自研的VLA模型支持下,其机器人在长程、灵巧能力上的突破。
灵初智能麻将机器人与现场观众同桌博弈的场景吸引了众多参观者围观。机器人可与现场观众共同完成30分钟以上的连续麻将对局,以毫米级精度完成摸牌、放置、碰杠等复杂操作,在与人类玩家的实时博弈中展现策略思考,动态构建决策链,自主完成碰杠等博弈决策。
据介绍,灵初发布的Psi R1模型已首次实现30分钟连续麻将博弈,展现了机器人在开放环境下处理复杂任务的突破性能力,这标志着具身智能从简单动作执行向真正的认知决策和长程操作的关键跃迁。
灵初麻将机器人可完成自行抓牌和打牌、完成碰杠等博弈决策。 灵初智能
此外,灵初的自主打包机器人也展现了在商业场景中的实际应用,机器人仅接收"将桌面物品打包"的自然语言指令,便可自主分析商品排列、确定操作顺序、完成扫码与装袋动作。
工作人员表示,整个流程基于VLA模型的分层架构:上层大模型负责理解任务并规划顺序,下层强化学习控制器负责执行动作细节,支持商品级泛化与实时调整,无需逐一标注或人工干预。
在7月26日举行的2025人形机器人与具身智能创新发展论坛上,国地共建人形机器人创新中心首席科学家江磊表示,我国人形机器人目前在“大脑”、“肢体”等部分技术取得领先,“小脑”将是下一步竞争的焦点,
江磊介绍,目前具身智能行业整体处于“0.0至1.0”的中间阶段,0.0阶段是从感知到执行的“预训练阶段”,此阶段的重点就是VLM、VLA、VLN等大模型,且正在面临数据瓶颈的问题;1.0阶段则是从认知到执行的“后训练场阶段”,未来需要通过“世界模型”,打造虚实融合的数据场景。
他指出,具身机器人“走跑跳”能力的进展给上个二十年画上了圆满句号,而“能干活”则是下一个十年的风口。展望2027年,我国人形机器人综合实力将达到世界先进水平,产业加速实现规模化发展,应用场景更加丰富,相关产品深度融入实体经济,成为重要的经济增长新引擎。