当前位置: 首页 » 资讯 » 新科技 » 正文

关于人形机器人的理想与现实,这些人说了点实话

IP属地 中国·北京 编辑:朱天宇 硅星人 时间:2025-07-24 12:21:02


作者 | PRO
邮箱 | pro@pingwest.com

这是一场关于人形机器人产业理想与现实的最坦诚的对话。

6月5日,在北京前沿国际人工智能研究院旗下“月光社”举办的“走进松延动力”研讨活动中,北京前沿国际研究院理事长、英诺天使基金合伙人王晟,松延动力创始人&董事长姜哲源、灵御智能创始人&CEO金戈,与硅星人创始人& CEO 骆轶航一起探讨了人形机器人产业面临的核心矛盾、产业现阶段聚焦务实落地领域、技术层面挑战、行业共识等关键问题。

以下为对话实录整理。

骆轶:今天的话题聚焦两点:一是公众和产业如何认识当前机器人产业现状、对齐对人形机器人产业发展的预期;二是争取形成对具身智能和人形机器人产业发展的一些共识。

松延动力参加了北京亦庄的第一届机器人马拉松长跑比赛,获得了亚军。在那之后,松延的人形机器人 N2 接单接到手软。可见,公众了解机器人基本是通过机器人表演(空翻、跑步、俯卧撑、踢足球、应急救援),在此基础上形成对机器人的预期和能力想象,并因此购买。

能不能请姜哲源讲讲:竞技比赛用的机器人和交付给客户的机器人之间,是否有外界不知道的差异?这种落差是否必然存在?如何解决?


公众看到的人形机器人,与现实当中的人形机器人,有哪些不一样?

姜哲源:谢谢骆少。我可以从成本管理分析的角度讲这事。确实大家看到视频里机器人能做空翻、跳跃、打拳等各种神奇动作,但买回家后只能走、挥手、握手。为什么会这样呢?不是公司造假或骗客户。我们在马拉松比赛的机器人和交付客户的机器人,除了里边的程序差别外,几乎一模一样。唯一的改动,我们在马拉松的机器人后面引出一根线,方便换电池。马拉松21公里,肯定需换一次电池。拔电池后整机就下电了,下电之后意味着电脑关机;插新电池后需两三分钟启动。所以为省时间,我们引出一根线:用另一块电池接线上确保机器有电,再把原电池拔下来,换上新电池后拔掉线,每次省两三分钟。

这是我们比赛准备的一个策略,除此之外没有任何差别。我相信宇树在国际比赛中的机器人跟交给客户的硬件没有任何差别。那为什么从能力上讲看着有这么大的差异呢?最主要原因在于我们不知道客户怎么用,开放太多能力给客户的话,我们也不知道他们怎么用这个机器人。比如说如果我们把空翻放给客户,我们很难确保客户不会每天连着翻个100来次,这样售后成本完全兜不住了,我们不能说你不允许用这个功能,你不能用太多这个功能,因此我们不敢给客户放空翻功能。

另外是安全性的考量,机器人空翻,一旦翻失败了别砸着人,这是很严重的问题。因此我们交给客户的机器人从硬件本体来讲,跟我们参赛的基本上没有任何差别,但是我们的机器人上不敢放太多高动态的动作,差别就是在这儿。

骆轶航金戈在做机器人的“智能”部分,这几个月一直在探索机器人“大脑”和"小脑”的完善,类似机器人马拉松比赛这种方式,对公众、客户甚至产业界人士认知机器人产业的现状和潜力,有哪些好处?有哪些副作用?

金戈:感谢骆少,也感谢北京前沿国际人工智能研究院给了这个机会。我们公司是和清华大学自动系合作主要做机器人上肢的控制,尤其是解决仿生臂、灵巧手的控制问题。我们希望机器人能尽快进入到家庭、各行各业,帮我们干活和做事,解决一些操作的问题。

人们很大程度希望它能够自动的、不需要人工干预的完成这些任务,我们希望在这个方向上去做努力做贡献。在现有端到端感知规划模型成功率不高的现实情况下,有没有其他的兜底方案,帮助解决在使用场景中成功率不高或可靠性不佳的情况?这是目前我们在试图解决的问题。

回到您刚才的问题,我认为现有的用比赛的方式让公众认识到机器人真实的智能、机器人硬件以及能力上限的水平,是非常好的一种方式。因为目前机器人还处于一个初期的阶段,是机器人公司的早期研发阶段,它没有什么可以在生产生活中展示给公众的窗口,目前展示给公众的窗只有两个:一是机器人公司发布的宣传片和宣传视频,当然是精选出来的、经过剪辑的成功部分。这可能会让公众有超过机器人实际能力的的期待。比赛则是另一种模拟真实场景,展示能力上限的好方式。大家经常看到宣传片做得都很漂亮,但比赛的时候表现可能更接近真是能力的表现。

比赛创造了类似实际的场景。因为现有机器人的可靠性直接用于生产,会带来一些不确定的后果影响生产结果,但比赛不会有这样的问题,比赛刚好创造一个虚拟环境,最大程度表达机器人能力上限。这有助于公众更准确认识到今天机器人的能力水平,从而有准确期待,这种准确期待非常有助于机器人更快应用到各行各业。

甲方过高期待会导致乙方无法实现的痛苦,因此我们希望甲方能清晰的理解目前机器人能做到什么不能做到什么。

王晟:这个问题特别有意思。我们知道在二战结束时,范内瓦·布什给罗斯福总统写了一个科技发展规划,叫《科学无尽的前沿》,这个规划使得科技成为美国的国家事业,成为美国科技政策的蓝图,美国因此建立了持续的科技创新动力。

美国科学促进会首席执行官、《科学》杂志执行主编拉什·D.霍尔特写了再版序言,霍尔特对范内瓦做了高度评价,但也指出了《前沿》唯一的不足就是脱离了人民群众,把科学变成了一群极少数科学家做的事。而现在这个时代,媒介互联网信息的平权,知识平权、认知平权,需要结合大众,所以我觉得这不是一件坏事。我们得让大众了解、大众知道、大众关注才能更好地促进科学的进步。

我们知道李飞飞每年都做一个 AI 报告,对全球各地对 AI 发展预期的乐观性进行调研,中国对AI的乐观性排名第一。中国人认为 AI 会给大家带来更好的生活,老百姓乐观性可能超过75%。美国是极度悲观,65% 的人认为 AI 会让我失业,让我变得更加不好,只有 35% 的人持有乐观态度,这可能对 AI 真正的落地会有蛮大的影响。如果没有这些机器人赛事的曝光,对机器人企业来讲,就更是闭门造车。

骆轶航:作为一个投资人,您怎么看一个机器人公司是不是一个值得投资的标的?


王晟:这一波的具身智能和机器人,包括机器人的AI,有些人选择下注,有些人选择不下注,这背后有很多原因。在我们来看,什么样的机器人公司值得投资?一是相对乐观,另一个是理性,有扎实的知识储备和认知,以及很强的逻辑思考能力,能对未来技术范式的发展做一定的预测,预测可能不准确,但相信理性思考之后的结果,谁符合,就相信他做的事情大概率是对的。

剩下的无非是团队优秀不优秀,其实团队优秀很难评价。我们过去做过愚蠢的事情,列了非常多的维度打分,毫无用处。投资决策的基础是:必须见过足够多的好东西,就好比艺术家、美食家和文玩收藏家,见过的、体验过的好东西足够多,就知道好不好。很多投资人其实没有见过好东西。

而我们希望80%的项目我们都见过和聊过,你见过什么是好东西,才对好东西有选择权。

骆轶航:红杉早期有一个著名投资哲学:押注赛道而非赛手。但是投大语言模型、多模态模型和机器人产业时,这个策略可能就失效了。因为一笔投资钱一上来就很多,几千万上亿人民币,所以押注赛手本人很重要。松延动力和灵御智能,一个专注机器人本体和强化学习,一个专注机器人上臂的智能化,你投这两个赛手的原因是什么?

王晟:哲源做松延动力,他做了很多不符合他这个年龄(注:姜哲源生于1998年)的一些巨大的人生决策。不止一次,我们看到他做了极其勇敢的选择和决策。优秀的人可能非常多,但你只能投资你欣赏的和喜欢的人。这个人很优秀,但就是跟你聊不来,这种情况我们经常见。

投灵御智能也很有意思。因为英诺基金总是对未来半年到一年的 AI 和机器人具身智能做一些预判,我们每次下注都在产业大共识形成的前几个月就投了,投完之后几个月,产业大共识来了,估值就会涨得很快。灵御智能就是我们希望投的一个,因为他做 L2 的具身智能解决方案。我们现在下注的所有具身智能公司都是奔着 L4 去的,直接替人进工厂,叠被子进家庭,把人踢掉,省很多钱,但非常难做。

就好比自动驾驶一样,马斯克在2017 年 Tesla 发布会说明年我们会实现全自动驾驶,L4级别的满世界跑,现在快10年了也没完全实现。因为有了现在的 L2 自动驾驶阶段,特斯拉才强大。通过 L2 辅助驾驶了,收集很多数据,持续用于模型训练,从而变成世界上最强大的自动驾驶公司。换句话时髦的话,我们跟金戈和他的灵御智能有“共振”。

2025年是人形机器人的商业化元年,需要做什么?

骆轶航:我想了解一下机器人客户的具体情况。我们现在能想到的客户门类:第一类是展示、表演、教育、科研实验,客户以机器人本体做基础,搞算法和研发。第二是机器人领域的国外同行,买中国机器人去搞研究,拆开了看它们是怎么做的;第三才是真实客户场景。哲源能讲讲现有客户种类各占多少比例,以及我们更在意的哪类客户么?

姜哲源:具体的比例或许不太方便透露,但大致可分为四大类:科研、教育、商演和文旅展厅。这四大领域基本上是当下主要的落地场景。

虽然我不提及具体比例数字,但最大的两块是教育和商业演出。一直以来,教育就是人形机器人或足式机器人的一个应用方向。为找到合适的应用场景,便将其作为教具,或是课程配套的实验器材,销售给学校以及有课程教育需求的客户。

商演是今年刚刚兴起的领域。大家可以看到,许多人形机器人出现在不同的场合,比如商场开业、周年庆典,以及婚庆等场景,以租赁的形式进行商业演出。

另外,比较有趣的是展厅方面的应用。我们原本并未预估到这会是一个较大的需求,后来发现该领域的需求量并不小。我们原本认为,在展厅使用轮式机器人进行讲解即可,为何要选用双足机器人呢?后来我们与客户沟通询问他们为什么不买轮式机器人时,他们说轮式的科技感不足,坚持要人形的。

所以今年在这个热度下催生了很多场景。另外,我们还发现了一些别人看不到的场景,但暂时无法公开。因为我们的价格最初下探到了一个可能没人触及过的范围,3.99万,也就是5万以内的价格带。这个价格带让我们发掘出了一堆价格较高时看不到的场景。明年我们可能会在这些方向发力,到时候可能会有更多应用场景出现。

刚才您提到了“真实应用场景”这个词,难道这些不就是真实应用场景吗?我觉得挺真实的啊。或者说,一个场景是否真实取决于它是否可持续。比如商演,今年春晚、马拉松这类活动催生了这个市场,商演市场热度可能会下降,但不会消失。就像舞龙、舞狮,传承这么多年依旧存在,热度也没有降下去甚至消失,对吧?还有展览展示这类纯展示需求,杜莎夫人蜡像馆都经营这么多年了,也有它的商业价值。所以关键要看这些市场板块的价值是否高。


骆轶航:所以价格一下子扎到3万9甚至更低,就是为了想把客户使用的各种可能性和场景都充分挖掘出来?

姜哲源:关于人形机器人本体赛道的投资,在 2023 年主要看团队背景,有没有科学家。到了2024年主要看Demo,了解能应用什么样的技术。2025年,就主要关注商业化落地了。

其实在2024年初,我们的 Demo 做得相当不错,虽然没有公开发布,但在行业内大家都知道。不过,我们公司一直比较低调,从不做宣传,以前在100篇机器人行业的报道里可能都见不到我们一次。

今年刚过完年那段时间,公司基本零订单,销售团队和营销团队都没有组建起来,什么都缺。但我们心里清楚2025年最重要的是商业化,当时我们认为可行的方向是借助线上渠道获取流量,以此推进商业化。所以当时我们希望将产品能力和定价等因素综合起来,让它成为一个有话题性的事情,最好能在圈子内甚至出圈,成为出圈的一个话题。

我们给 N2 定了 3.99 万的价格,这个价格比同行低至他们的1/5左右。我们认为这个价格最重要的是有话题性。而且我们核算过,虽然毛利率不算特别高,但还是能挣钱的,所以觉得可行。我们当时定这个价格,想着总比一整年没有商业化进展要好,于是就这么干了,发布了这个相对较低的售价。

骆轶航:这其实是个重大的决策。不过在实际运行和工况中,一个机器人不管是跑、俯卧撑、行走、空翻等等,它最常见的故障点可能有哪些?比如传感器突然失灵,或者让机器人连着做几十个后空翻之后它就烧坏了,再或者像半马比赛中很多被做成花絮的场景,机器人跌倒和“虚脱”等,它们是什么原因导致的?我们能把这些问题解决到什么程度?如何管理客户对未来的预期?可以从机器本体及其智能化方面来讲讲。

姜哲源:必须得讲这个问题。那我先说说从本体角度看哪些地方容易出故障:我们当时参加马拉松时遇到的最大问题就是线束容易松动,这个问题我在很多场合都提过。当时胳膊上的线特别容易松,而且不是线束里的电源线松,是信号线松。只要信号线虚接,就可能出现误码,误码积累多了,这一路就会直接关闭。这样胳膊就会失去一路电机信号,进而导致整个运动控制出现问题。

这是之前我们遇到了一个比较常见的问题。但在马拉松比赛期间,由于时间紧迫,实在来不及解决。当时我们刚完成一个项目demo,整个团队都疲惫不堪,而且只有一个月的时间准备马拉松,所以确实没工夫处理这个问题。马拉松结束后的两周,我们把这个问题彻底解决了。我们重新设置了线束,还进行了大量测试,最终彻底解决了这个问题。 我觉得这算低级错误,不是常见问题,也不具有普适性,是我们公司自己没做好。

另外有个特别容易出问题的地方,很多人形机器人公司应该都有同感,就是脚踝。人容易崴脚,机器人的脚踝也特别容易坏。刚开始的时候,脚踝电机很容易出问题,走一段时间行星架可能就变形了,变形后电机可能会卡死,或者间隙变得很大,会引发各种问题。后来我们对电机进行了大幅强化,也对传动连杆进行了大幅强化,还替换了轴承、轴等部件的材质和选型。 最后解决了脚踝的问题,其实在马拉松比赛前就把这个问题搞定了。

马拉松比赛前,我记得有一次半夜搞了一场活动,就是开放赛道让大家测试的比赛。当时我们的机器人跑的时候,跑到 12 公里,脚踝电机那块的螺丝断了。之后我们加了几个销子,把问题解决了。不过直到现在,脚踝还是最容易出问题的部位。虽然它的寿命比原来长了好几倍,但到了相应时间,最先坏的还是脚踝。

另外,过热也是个比较麻烦的问题。我们的情况要好一些,因为我们的机器人有一定的冗余设计,所用关节尺寸和机器人本体尺寸的设计是高爆发、冗余的状态。所以我们机器人过热的情况还好。

我觉得这是目前遇到的几个容易出问题的点。人形机器人行业要沉淀心态,好好做产品、做测试,把该测的项目都测完,走完所有流程,再推出新一代产品。我觉得这才是整个行业更健康、更理性的做法。

骆轶航:大家都把温度降一降。

金戈:我从上肢操作的角度讲讲。我觉得这可能不是故障问题,而是现有技术的限制。现有技术下,让机器人智能操作存在一个矛盾,即操作成功率和操作速度、效率的矛盾。某些流传很广的机器人Demo,乍一看很惊艳,机器人能自己收拾家务等,但仔细看右下角会标注 8 倍速。这意味着为了保证一定的成功率,机器人的工作速度要大幅下降远远低于人类效率,这就让机器人离实际应用还有距离。

我们希望机器人工作得又快又高效,但这样成功率就难以保证。你可以把这看作故障,也可以认为是现阶段机器人智能的局限。从论文和最先进的研究来看,在相对泛化的垂直场景中,机器人工作的成功率暂时能达到 80%多就很不错了。而且这还是在动作有所放慢的情况下。

我们提出的解决方案是,在成功率只有 80%多的情况下,能否让机器人投入实用。汽车行业有类似应用,汽车只能在高速公路或封闭道路上自动驾驶,不能行驶的路段就找人接管。所以我们提出了 L2 混合驾驶方案,希望机器人能自我判断。如果对某项操作没把握,或者操作失败了,可以呼叫人来接管或处理。用这种兜底方案解决目前模型成功率不可靠的问题。

如果说机器人投入使用面临硬件挑战,我觉得网络环境是个比较大的挑战。中国的网络环境建设很优质,正常情况下完全能满足需求。但如果网络环境波动或受到攻击,机器人的操作和行为就会受影响,这需要通过算法优化来解决,目前我们也在努力攻克这个问题。

机器人行业产业链长,很多企业面临多方面的技术挑战,只有产业链上的企业共同提升技术,才能更快实现机器人进入千家万户的目标。


关于技术瓶颈和技术路径,人形机器人产业有共识了吗?

骆轶航:接下来这两个话题涉及软件侧和模型侧。我对从 L0 到 L4 这样的仿汽车自动驾驶等级来衡量机器人智能化很感兴趣。过去一年外界看,机器人产业在模型化、多模态模型和模型训练方面进展不大,一些问题依然存在,比如在仿真环境中收集数据、训练数据和优化算法等,过去一年,模型侧似乎遇到了瓶颈。是用仿真数据还是真实数据?

大家普遍认为大语言模型是机器人的大脑,识别动作、模态、意图和处理意图的是小脑。现在的主要堵点和卡点在哪?是数据量不足,仿真数据质量有问题,仿真数据的获取方式不同于大语言模型语料的获取,总之进展确实不大。

金戈:目前业界基本达成共识,大概五六个月前还没这么明确,现在大家都认为数据不足是核心问题。大模型的三要素是算法、算力和数据,数据是关键,巧妇难为无米之炊,解决数据不足是当务之急。我们看到很多企业在建机器人数据采集中心,收集真机数据和仿真数据。

另外要强调的是,真机数据和仿真数据并不冲突,它们相互补充,都面临挑战。收集真机数据需要大量机器人,成本和难度高。仿真数据也有挑战,机器人仿真比汽车仿真难,汽车仿真只要保证汽车不撞到东西就行,只关注汽车的形状和大小;而机器人操作要和物体强互动,仿真物体的形状、物理量、重量、粘度、软硬和摩擦等都要准确。建立仿真数据需要时间和成本,虽然比建真实物体成本低,但也不容易。

现在大家已经发现了堵点,全球都在从不同方向解决数据问题,比如仿真、合成和真机数据收集等。就像《流浪地球》里的超饱和救援,大家从不同角度一起解决数据问题,我们的目标是去掉堵点,提升机器人智能。

姜哲源:我非常同意金总的观点。补充一下,现在各地有数据工厂模式,这是个很好的尝试,发挥了我国规模化生产的优势。但数据除了规模,多样性也很重要。

我常举一个例子,训练一个简单的图像分类模型,一个数据集有 10 张不同图片,另一个有 1 亿张相同图片,显然 10 张不同图片的数据集效果更好。所以我不确定数据工厂模式能否取得好效果,因为其场景单一,长期来看会出现边际效应递减的情况。我觉得应该到真实场景中收集数据,这值得上肢赛道的同行思考。

第二是关于仿真数据。我的观点是,单纯用仿真数据肯定不行。仿真机器人走路、跑步,拿硬质物品可能没问题,甚至一些先进的仿真器能模拟软体和流体,但举一个极端例子,让仿真器模拟炒西红柿鸡蛋,模拟蛋液从液态变成固态的过程,这个是一个难度极其之大的事情,对当下而言不具备可行性。所以全靠仿真数据是不行的。

骆轶航最后我们收个尾。大语言模型去年没共识,今年对做 Agent 有了一定共识。对于具身机器人,包括人形机器人产业,目前哪些方面有共识的苗头?或者我们认为哪些方面最应该形成共识?

王晟:我认为共识是动态的,机器人产业一直有共识,但共识一直在变。刚形成一个共识,可能很快就被瓦解,变成落后的共识。

比如投资方法论的共识。2023 年下半年,投资方向是人形机器人、基础运控和本体等,2024 年开始投资具身智能,先投小脑,再投大脑,现在又搞端到端。技术范式也从传统音控到强化学习、模仿、到现在的 VLA。这些都是共识,都不长久,这说明这个产业还不成熟。

所以未来还会快速产生小或中度的共识,但像大语言模型这样的超级共识,还需要很长时间。从投资角度看,明年大家不能只拼 demo了,产品要能落地,有实际应用场景,能提供价值,光表演不行。

姜哲源:晟总从宏观层面讲了产业共识情况,我说说我们细分赛道的小共识。现在运动控制用深度强化学习已经是绝对共识。2023 年还有人质疑四足机器人的运控方法不能用到这里,现在没人提这个问题了。硬件方面,目前低成本新机器人的硬件架构基本基于准直驱电驱关节。以前有人质疑是不是用液压或其他类型关节,现在至少在低成本机器人上,准直驱关节技术成了共识。准直驱关节减速比相对较低,用电流环做力控,成本低、系统简单可靠。不过未来可能会有新的技术成为共识,目前这种方法是有效的。

金戈:我非常赞同晟总和姜总的观点。我觉得现在行业还处于早期,不确定性多,技术方向没收敛,很多方面还在探索。从模型和上肢操作角度看,大家发现数据短缺是一个共识,另一个共识是,不能只依靠数据工厂在实验室采集数据,要让机器人尽快投入生产生活,比如工厂、商业场景,在实际场景中获取数据,提升模型能力,就像自动驾驶汽车先上路跑起来一样。

骆轶航:感谢大家的讨论,在制造业发达、对人工智能发展乐观、注重科学和效率的中国,机器人产业走向千行百业和千家万户,很可能是我们中国人拥抱 AGI 的方式。

点个爱心,再走 吧

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。