当前位置: 首页 » 资讯 » 新科技 » 正文

北京人形“金牌导游”机器人上线:会讲解更自主,聪明大小脑加持

IP属地 中国·北京 贝壳财经 时间:2025-12-12 20:17:03

“大家好,我是大家的专属讲解员,我一声令下,就能给大家带来沉浸式的(视频)体验”“我的另外三位好兄弟,马上要为大家带来一场由我们‘慧思开物’整体调度的协同作业展示”……

12月11日,在北京人形机器人创新中心(下称“北京人形”)的无人化展厅内,具身天工2.0机器人正引领观众穿行于展区之间,它不仅能够自主讲解,还能同步调度天轶2.0机器人,完成物料搬运、倒料、分拣与打包等一系列操作,而这一切均无需人工干预。

这背后依托的是北京人形最新发布的全国首个全自主无人化人形机器人导览解决方案。该方案以“慧思开物”通用具身智能平台为核心,融合了全自主导览、拟人交互、多机协同与全局IoT联动能力,可适配展厅、商场、景区乃至业务讲解等多种场景。


具身天工2.0机器人正在进行导览讲解。图/受访者供图

“慧思开物”赋能,机器人解锁自主导览

新京报贝壳财经记者了解到,具身天工机器人的全自主导览能力,源于“慧思开物”平台构建的“感知-决策-执行”技术闭环。该体系通过AI大模型驱动的具身“大脑”、数据驱动的具身“小脑”,搭配多模态融合感知系统,使机器人实现从引导到讲解的全程独立运作。

北京人形机器人创新中心CTO唐剑向新京报贝壳财经等媒体介绍,该系统的运行基于三层能力:全自主导航(建图、定位、移动)是无人化的基础;沉浸式讲解依托机器人与企业内部IoT系统的打通,可实现任务和应用的自动触发;全局调度则依托“慧思开物”作为分布式多具身智能系统的能力,云端大模型进行统一规划、拆解任务并下发。

具体而言,多模态感知系统融合了各类传感器信息,可以精准识别语义与几何特征,使机器人能区分观展人流、展品与障碍物,实现稳定行进。AI“大脑”作为决策中枢,负责解析场景、拆解任务并指挥“小脑”;“小脑”作为执行单元,则将指令转化为精准动作,并让机器人在遇到拥堵时实时重新规划路径。

在实际演示中,天工2.0还能同步指挥展厅大屏播放视频,这依托于“慧思开物”平台的全域互联能力。通过支持MQTT、TCP/IP等协议的开放接口,机器人可直接调度全场IoT设备。例如,当机器人行至核心展区,平台自主触发指令:控制展区灯光、大屏幕自动切换视频、场景演示内容同步启动演示,整个联动过程响应延迟低至50毫秒以内。



“慧思开物”的多智能体调度机制可实现多机协作。图/受访者供图

此外,“慧思开物”的多智能体调度机制还实现了多机协作。导览机器人可自主调度其他机器人协同工作,例如在讲解时指令天工2.0、天轶2.0等机器人同步演示搬运、分拣、打包等任务,从而完成从“单点讲解”到“多机联动”的体验。

自主导览方案具有可复制性

可复制的技术,必须指向可规模化的商业场景。唐剑介绍,这套全自主无人化人形机器人导览解决方案具有很强的可复制性,在新展厅中部署时,通过机器人自主建图、标准化接口对接客户IT系统、利用RAG技术导入场景知识库,可以实现快速落地。

据介绍,在商业化布局方面,北京人形除了攻坚物流搬运、分拣等结构化工业场景,还将拓展导览、导购等商业场景,最终进入危险、肮脏、重复的“3D”领域。目前,北京人形已与国家电网、福田康明斯等企业展开合作,同时推动全自主无人化人形机器人导览解决方案成为商业化产品。

谈及行业发展热度,唐剑坦言,如果人形机器人只是“热闹而无用”,无法在产业中实现真正的价值、没有规模化落地,就会产生泡沫。“今年大部分企业还处于POC(概念验证)阶段,但明年行业一定会有大规模的产业化应用出现。”

支撑这一商业前景的,是快速演进的技术路径。唐剑分析,当前主流的“大小脑分层”路线中,上层由VLM担任“大脑”,负责空间理解与任务拆解,下层VLA作为端到端模型接收多模态信号并输出运动轨迹,虽然该路线目前面临数据和架构优化的提升空间,但中长期可通过特定场景数据微调实现规模化落地。而“世界模型”路径,能基于指令和当前图像生成动作视频,再通过模型转化为机器人实际动作,泛化能力更强。

唐剑还表示,中国人形机器人产业链相对完备,硬件制造能力和运控算法处于世界领先水平,同时,中国机器人在高价值场景的落地推进上具有明显优势;在软件算法如VLA、世界模型上,中国与美国处于齐头并进的状态,尤其是具身智能需要大量真机数据,中国在数据积累方面具备显著优势。

新京报贝壳财经记者 韦博雅

编辑 岳彩周

校对 翟永军

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。