![]()
3月28日,作为中关村论坛平行分论坛,2026中国科幻大会现场,北京石景山具身智能触觉及多模态感知数训创新中心正式揭牌。
据记者了解,该中心由北京石景山科技创新集团有限公司与他山科技合作打造,锚定具身智能产业发展需求,确立触觉、异构、自主无人数采三大技术方向,打造集多模态数据采集、算法训练、场景落地于一体的全流程技术转化平台。
数据问题是当下机器人产业智能化升级面临的核心挑战之一。中关村论坛“百亿具身智能对话”环节,星动纪元联合创始人席悦认为,当前具身智能发展最大难点仍是数据。
从具体业务落地场景来看,席悦认为,真实场景数据采集难度高,需场景方开放权限,同时大规模采集存在成本高、耗时长的问题,而现有替代方案存在局限,行业常用的1:1 复刻真实场景自建训练场模式,因依赖工程师全程参与采集、训练、部署及问题定位,导致整体效率低、成本高。
席悦认为行业可以构建“数据采集-模型迭代”的闭环数据飞轮,让机器人能在真实环境中自主处理各类极端情况,持续提升体系效率;二是推进 “人类演示 + 真机采集” 的组合采集模式,但目前仍需攻关二者在本体构型、运动形态、感知方式上的差异问题。
原力灵机创始人唐文斌认可数据是具身智能当前的瓶颈之一,但并非全部问题。在他看来,数据采集本质是钱与时间的问题,通过投入资金买机器人、建训练场、雇遥操作人员、外包标注等,可快速堆积百万小时、亿级样本的数据量,因此“有无数据”并非行业壁垒。真正建立竞争优势的是企业能否从真实场景自动回流数据,能否搭建高效数据飞轮闭环。
智平方目前已具备多种数据获取途径,但回归到现实,联合创始人张鹏仍认为真实场景的数据价值无可替代,这也是行业当前必须重点布局的方向——通过一线实际部署的产品实现数据回流并将数据沉淀回来的部分,是最宝贵的数据资产。在保障安全的前提下,智平方也会与客户共享这部分数据。
据记者了解,目前北京石景山人形机器人数据采集训练中心四期项目主要与乐聚、他山、睿尔曼、灵初等公司合作,尝试破解机器人行业的数据短缺与质量瓶颈。
对于目前机器人数据的供需问题,一位行业人士对记者表示,当前具身智能领域正经历数据体系重构,无本体数据技术(如第一人称视角数据的EGO、通用操作接口的UMI 方案)兴起,使此前依赖重资产投入的遥操作数据采集工厂可能陷入发展困境。
从数据价值维度来看,该人士称,真实场景数据仍是机器人模型训练所需的金字塔尖数据,但行业普遍面临两大核心问题:一是数据质量与数据管线设计的标准化缺失;二是数据处理能力存在显著行业鸿沟,并非所有厂商都具备搭建高效数据处理体系的技术实力,且行业内缺乏统一的数据技术诀窍共享机制与基准评测体系,导致数据应用效率参差不齐。
该人士称,若未来EGO、UMI等无本体数据技术能够实现普及,可以进一步放大场景资源的核心稀缺性,企业方面也有可能摆脱对传统数据采集工厂的依赖,直接在真实场景中完成数据采集,场景的可及性与多样性将成为数据竞争力的关键变量。
因此,从技术升级迭代趋势来看,具身智能需要亿级小时级训练数据,当前总量仍严重不足,但部分与主流技术路线错位的核心资产未来可能面临贬值风险,如依赖机器人本体、固定场地的重资产中心可能产生产能利用率下滑、单位成本飙升的情况。
长期来看,数据领域的核心竞争逻辑将发生根本转变,从“是否拥有规模化训练中心”的硬件比拼,转向真实场景获取能力、场景与数据闭环迭代效率等方面。





京公网安备 11011402013531号