本文时代周报 作者:朱成呈
作为具身智能的代表之一,人形机器人发展正加速迈进产业化临界点。
近日,在外滩大会上,人形机器人展区是最热闹的角落:踢足球、调鸡尾酒、跳“女团舞”。舞台之外,它们还要翻越障碍、操作电闸、模拟救援。一场职业技能表演赛,让观众看见机器人的多种“可能性”。
但热闹之下,行业仍处在十字路口。数据不足、场景稀缺。人形机器人会跳舞、会翻跟头,但它们如何在真实世界中兑现自身价值,行业仍在寻求解决方案。
9月12日,多伦科技(603528.SH)与众擎机器人达成合作,计划未来三年采购不低于2000台人形机器人,投入机动车查验与交通管理等场景。多伦科技成立于1995年,长期布局交通出行领域,从驾驶人智能培训和考试系统、驾驶培训模拟训练,到智慧交通综合管理、车联网和车检整体解决方案,业务覆盖全国31个省份400多个城市。
据悉,双方合作的交通疏导人形机器人的原型机,预计于2025年底完成研发出样。
“三年2000台只是起点”
人形机器人正在寻找现实的落地路径。
交银国际在研报中指出,工业场景由于标准化程度高、流程可编程性强等特性,已成为人形机器人应用渗透的先行阵地。虽然现阶段技术成熟度仍集中在研发测试与特定场景验证期,但随着核心零部件成本下探、运动控制与AI决策系统持续迭代,叠加应用场景向服务业、医疗等领域的横向拓展,预计2030年之后产业渗透率将进入指数级增长通道。
在多伦科技看来,“大交通”是下一个值得切入的场景。多伦科技董事长章安强向时代周报记者表示,“智慧车管需求迫切,车管所日常业务包括车牌、驾驶证的办理,人流量大,警力消耗严重,‘科技兴警’已成为新需求。此外,全国每年处理超过两千万台二手车过户,人工查验不仅效率低,透明度也难以保证。”
“机器查验更公平。”章安强说。多伦科技自主研发的查验机器人能依靠AI和机械臂完成检测,并实时联网公安数据库,减少人为差错。据悉,该产品原型机已研发完成,正在进行试用验证,计划于2025年底投入市场。
多伦科技或许是众擎机器人较为理想的合作伙伴。众擎机器人创始人赵同阳坦言,“众擎聚焦最易落地、需求量大的场景。多伦科技负责提供需求方向,而我们则提供机器人本体。在手部、姿态、胳膊、腿部等技术上,我们已开放部分接口促进合作落地。”
除了查验机器人,交通疏导机器人同样是强需求。交警在夏天高温、冬天严寒或暴雨中执勤,体力消耗极大。
“公司研发的交通疏导机器人会与路口信号实时联动,实时同步路口状态。同时,与众擎合作可为机器人搭载环境感知技术,能实时感知周边动态,遇到危险能自动避障、绕开,甚至通过喊话呼叫预警。”多伦科技技术研究院院长张铁监表示,该机器人还配备类似民警执法记录仪的摄像系统,整个工作过程都会录像记录,能有效杜绝突发危害情况。
赵同阳强调,这些人形机器人并非“遥控玩具”。“之前没有明确场景时,人形机器人多靠遥控,交付给多伦科技的人形机器人则是独立运转的。”他说。
章安强表示,全国超3000家车辆管理单位(如车管所等)、各地交通安全体验中心,以及交通、路口和大型商业中心等场景,对人形机器人需求旺盛。他认为,三年采购2000台只是起点,未来市场潜力还会更大。
高工机器人产业研究所(GGII)预测,2025年全球人形机器人市场销量有望达到1.24万台,市场规模63.39亿元;到2030年全球人形机器人市场销量将接近34万台,市场规模将超过640亿元;到2035年,全球人形机器人市场销量将超过500万台,市场规模将超过4000亿元。
数据可反哺训练
在人形机器人落地的过程中,数据始终是关键掣肘。
华泰证券在研报中指出,人形机器人软件需要强大的模型表征能力和大规模高质量数据。大脑泛化依赖数据以及小脑运控和硬件耦合,而机器人运动和操作的数据模态更复杂,需要从头开始定义数据,还要在真实环境里长期、大规模采集。
在外滩大会上,宇树科技创始人王兴兴同样提醒,具身智能在数据和模型算法上仍有不少挑战:数据采集和质量不足、利用率不高,多模态数据融合效果有限,模型与机器人控制模态的对齐也很困难。
多伦科技的业务横跨驾驶培训与考试、智慧车管、交通管理等多个环节,积累了大量驾驶行为、考试场景、交通流等数据。赵同阳据此认为,与多伦科技的合作能解决部分数据难题:“多伦科技有大量的优质数据,在专业环境下知道如何回答和处理,这些数据能够在众擎训练专用场景时提供帮助。”
“机器人不能闭门造车,它必须深入行业,收集真实数据和经验,才能在设计中更实用、更适配行业痛点。”智元机器人合伙人姚卯青此前接受时代周报记者采访时强调。
在具体的大模型路径上,赵同阳表示,众擎并不是在“端到端模型、VLA 模型、世界模型”三者之间做取舍,而是将它们嵌套结合。
在他看来,端到端模型适用于简单、重复、低数据量的动作,比如打螺丝、装配,类似条件反射;VLA模型主要用于把复杂动作进行逻辑分解,再交给端到端模型完成执行;世界模型则被视作顶层技术,能够在缺少直接数据的情况下,根据现有知识库中的数据处理之前没有碰到的问题。“这是一个三环嵌套的关系,不是取舍关系。”赵同阳说。