![]()
网络
在具身智能的激进演进中,行业正迅速撞上一面无形的墙:数据荒。
如果说 2025年是具身智能的“硬件元年”,那么2026年则是彻底的“数据决战”。从OpenAI支持的模型演进路径看,数据需求正呈指数级爆发。从 Pi0 的 1 万小时训练,到 Gen-0 的 27 万小时。业内普遍预判,2026年头部具身大模型所需的真机训练数据将达到百万小时级别。
然而,现实是数据获取低效且昂贵 。传统的遥操作方式不仅每小时成本高达数百美金,且充斥着大量无法复现、传感器不同步的“废数据” 。在 Scaling Law 的物理战场上,谁能率先规模化地开采出高纯度的“物理石油”,谁就拥有了定义下一代通用机器人标准的话语权 。
鹿明机器人(LUMOS)占据了一个独特的生态位,不做单纯的整机商,要做具身智能时代的“超级数据工厂” 。这家成立仅一年的公司,不仅要做“卖水人”,还要“定义水的标准”。
这份自信源于团队的硬核背景。创始人喻超毕业于清华大学,自2016年起从事机器人学习算法领域研究,曾主导构建追觅科技具身机器人业务,并参与开发了小米CyberDog等多款消费级机器人产品。CTO曹俊亮是上海交通大学机械工程博士,曾深度参与过多款性能优异的具身机器人产品的研发工作。联席CTO丁琰为纽约州立大学人工智能博士、前上海AI lab明星研究员,是一支拥有深厚产业经验和技术积累的团队。
2025年12月,鹿明机器人宣布完成Pre-A1、Pre-A2两轮融资,金额数亿元,投资方包括鼎晖投资,南京创投、金景资本、金固股份、申能诚毅等知名投资机构。
“量产老兵”基因,让喻超对“不能落地的实验室技术”有着天然警惕 。喻超提出了一个 “鹿明指数”:场景价值 / (数据成本 × 硬件成本),试图用工业逻辑拆解 AI 的高昂成本 。
鹿明研发的 FastUMI Pro 系统,将单条数据采集从 50 秒缩短至 10 秒,效率提升 5 倍,综合成本砍掉 80% 。通过独创的 8 道工业级数据质量评估体系,鹿明将数据有效率从行业普遍的 70% 提升至 95% 以上。其野心在于“去耦合”,让一套数据适配数十种机械臂,打破数据孤岛,让机器人说同一种“语言” 。
这是一个从“工具”到“平台”,再到“生态”的精密布局。
对于2026年,鹿明设定了一个惊人的目标:建立100万小时的UMI数据产能。在AI领域,数据量的量级跃升往往意味着智能的涌现。如果说GPT-3的出现是因为互联网文本数据达到了某个临界点,那么鹿明正在赌的,就是具身智能的“ChatGPT时刻”将在这100万小时的数据堆叠中诞生。
以下为创投家与喻超、丁琰的完整对话,略有删减创投家:为什么在这个节点选择创业?
喻超:我的技术信仰始于 2016 年看到的 Pieter Abbeel(现 OpenAI 首席科学家)关于神经网络控制机器人的博士后论文。那是全球首次证明人形机器人的控制可以被神经网络范式(而非复杂的数学建模)替代。
于是在2016年毅然决然加入了一家创业公司,这应该是国内第一家用端到端方式控制人形机器人的公司,我在那边做算法负责人,我们开发出了人形机器人,并且用纯端到端的方式实现了RL的行走。2020年,我加入追觅,从0到1搭建人形机器人相关业务,带领团队完成了追觅对于小米cyberdog项目的量产交付。
2024年,我选择创业,是因为看到了大模型技术在NLP领域的突破,我相信Scaling Law在具身智能领域也是成立的,通用智能与机器人相结合的拐点已经到来。
而且看到了行业存在很多待解的痛点,比如基础设施不够完善,无法支撑具身智能在场景里规模化落地,现在正是构建行业基础设施、建立数据标准的最佳时机。
创投家:为什么提出"鹿明指数"来衡量公司价值,这个公式具体是什么?
喻超:场景价值比较好理解,是具身智能在场景里面能实现的规模化价值。为什么要除以数据成本和硬件成本呢?数据成本是通向更好智能性所需要的成本。硬件成本是最终在实际场景里面落地消耗的边际成本。数据成本和硬件成本越低,才能释放出更大的场景价值。
基于这样一个指数定义,我们还有一个观点,基础设施的完善是场景高质量落地的前提。可靠、符合场景要求的硬件本体是具身智能的落地保障,而高质量、低成本、可规模化的数据,是提升模型泛化能力的基础。
基于这个认知,我们一直围绕着本体、场景、数据这样一个飞轮来布局公司业务。“本体”是场景落地的关键保证,我们在过去也推出了4款不同的“本体”,适应不同场景。场景部分,我们跟三菱、中远海运、德马科技形成了比较深度的战略合作。在场景里面落地的过程中,数据规模化又能带来智能化的提升,这是最关键的点。
刚好FastUMI Pro的低成本、高效率数据采集能力,能够撬动这样的循环。这个指数体系指导我们不是单纯追求某一个维度的优化,而是系统性地构建从硬件、数据到模型的全栈能力,最终实现场景价值的最大化。
创投家:详细聊一下FastUMI Pro系统。
丁琰:FastUMI Pro是我们从学术界的FastUMI升级到工业级的无本体数据采集软硬件系统。我从2024年3月份就一直从事UMI相关研究,是大陆最早做UMI的人,没有之一。
我们做了大量工程化和标准化的独创工作。首先是硬件层面,FastUMI Pro集成了为 UMI 场景定制的高性能传感器,能稳定实现了60Hz 高频记录,并保障了多模态信息的毫秒级同步,能够满足未来一两年模型推理速度提升的需求。
软件层面,为了实现了数据与本体的完全解耦,能够快速适配市场上数十种不同的机械臂,这意味着鹿明在底层协议和适配算法上做了大量的独创开发,使得“一套数据,全机通用”。
数据质量管理方面,独创了 8 道工业级数据质量评估体系。这套体系能够从源头过滤掉视觉与位姿未对齐、传感器不同步、轨迹不可复现的“废数据”,将数据有效率从行业普遍的 70% 提升至 95%以上。与传统遥操作采集方式相比,FastUMI Pro通过创新的硬件架构与软件算法,将单条数据采集时间从50秒缩短至10秒,效率提升5倍,同时将综合成本降至传统方法的五分之一。
创投家:现在市面上做具身智能数据采集设备的很多,大家都声称“低成本、即插即用”你们和他们的区别是什么?
丁琰:现状非常残酷。设备很多,模型很少。 很多团队买了低成本UMI设备,但行业内几乎看不到公开、稳定、可复现的UMI模型案例。原因不在训练阶段,而在于大量的UMI数据从生成开始就不具备进入训练管线的条件,说白了就是数据不合格。
市面上有一些产品并非系统设计的,而是很多模块“拼凑”出来的,这样一来,产品的带宽架构非常脆弱,出现掉帧等一系列问题,导致无法稳定Replay交互记录。
创投家:“废数据”和“脏数据”二者有什么区别?
丁琰:这是我们独创的观点。很多人直接找众包团队去采集,觉得“天然去雕饰”最好,但这其实是“废数据”。 举个例子,叠衣服,人类自然的叠衣服动作对于机器人来说往往是无效的,因为机器人需要特定的“技巧性动作”(比如特定的抖动、铺平轨迹)才能理解物理特性。没有经过设计的、缺乏“信息密度”的自然行为数据,机器人看了也学不会,数据不仅要“真”,还要“有教学意义”。
“脏数据”是指那些包含抖动、漂移、时间错位的数据。在单视角(Single View)的UMI采集下,这些噪声不会因为数据量的增加而被平滑掉,反而会被放大。 这就好比你给模型喂了大量“手抖”的示范,模型最终学出来的策略也是抖动的、不可用的。所以我们强调,数据质量的高低不只是清晰度,而是“有效的信息密度”和“物理交互的精确性”。
创投家:你们怎么保证交付的数据“100%可用于模型训练”?
丁琰:我们独创了8道工业级数据质量评估体系,从硬件设计源头保障数据质量,为模型成功率负责。我们解决了最难的毫秒级同步问题,确保视觉、触觉等多模态信息在60Hz的高频下严格对齐,这是物理世界能被“Replay”(复现)的物理基础。
创投家:既卖采集设备,又卖数据集,还做机器人本体。你们到底想成为谁?
喻超: 我们的使命是成为全球领先的具身智能定义者和实践者。我们为行业提供数据和硬件的基础设施,联合我们的生态伙伴一起,用数据驱动智能,同时让智能去赋能千行百业,让机器人走进千家万户。
创投家:对于2026年,你们设定的核心里程碑是什么?
喻超: 2026年我们要建成100万小时的具身真机数据产能,目标是建成全球最大的具身真机数据集。这是具身智能Scaling Law生效的临界点,也是我们作为行业“数据燃料”供应商的护城河。
创投家:目前鹿明的目标市场主要在国内吗?海外市场有哪些规划?
喻超: 我们的客户不局限于国内。全球具身智能圈内,有超过三分之二的顶尖团队,正在使用FastUMI Pro,FastUMI Pro已经成为行业内验证和开发UMI能力的 “标配装备”,我们非常看重海外市场,会持续积极布局。
创投家:作为一家初创公司,进入竞争激烈的具身行业的,你们会感到压力吗?
喻超: 坦率说,压力一直都有。但是只要公司跑得足够快,所有的外部环境变动或竞争都不会成为致命问题。
我们的核心逻辑是抢占时间差。到2026年,我们要建立全球最大的UMI数据集。这种数据的先发优势和生态位占领,是很难在短时间内被追平的。(作者|郭虹妘,编辑|陶天宇)
更多对全球市场、跨国公司和中国经济的深度分析与独家洞察,欢迎访问 Barron's巴伦中文网官方网站





京公网安备 11011402013531号