文|邱晓芬
编辑|苏建勋
朱森华是个把严谨刻进骨子里的人。
作为脑神经科学的博士后,在我们访谈当天,他将我们提供的一份访谈提纲,写成了一份七页纸、近万字的回复,当中还用字母、数字把观点分门别类,并做了图辅助理解,像是在完成一篇道地的学术论文。
研究大脑,就是研究人,这从朱森华的聊天习惯就能看出,他不会一直单方面的滔滔不绝,而是会停下来,询问我们对某些问题的看法,也会因为我的“文科出身、媒体背景”,调整回答方式。
在华为的六年时间里,朱森华曾担任华为云AI算法创新Lab主任,也是华为云AI部门智能机器人业务的开创者,同时还是“华为天才少年”们的面试官之一。
他曾带领一支“博士军团”,从零到一构建了华为云的脑与类脑AI云平台、华为云智能机器人业务,还孵化了华为云的首个具身大模型。
在这波具身智能浪潮中,华为不算高调。但如果对2023 年的华为HDC(开发者大会)有印象,应该会记得华为云抢在国内一众大厂之前发布了首个可真人交互的“具身工匠”能力原型。
![]()
△华为在2023年的HDC大会上首次发布具身大模型
这一原型搭载的便是朱森华主导研发的华为云首代盘古具身大模型。从当时的效果来看,这一具身大脑已经具备了真人能力,能对复杂任务进行自主规划,并自主生成动作指令等等。
2025年10月份,朱森华离职,创立具身大脑公司“具脑磐石”。选在此时创业,朱森华形容为“万事具备”。
成立两个月后,“具脑磐石”核心团队已搭建完毕,公司联合创始人之一是极智嘉智能叉车&极智链产品事业部总经理刘晋宇,其他成员来自华为、联想、旷视、极智嘉,具备10年以上的Al+机器人研发交付经验。
《智能涌现》独家获悉,由朱森华创立的“具脑磐石”,近期已完成数千万元的种子轮融资,资方为乐聚机器人、上海道禾长期投资、四川科创投集团、东方精工等。
在技术储备上,和过去大众熟知的端到端、分层等完全基于深度学习的具身智能技术路线不一样的是,朱森华想要走一条更特别的路径——用脑认知启发(Nerual AI)的范式来改进具身智能VLA。
《智能涌现》了解到,「具脑磐石」将借鉴人脑的认知神经机制,给具身智能VLA做算法架构的改造,比如引进人脑特有的抽象概念学习、选择性注意力等。通过这些算法“外挂”,减少机器人数据和算力的依赖,提升泛化性。
![]()
AI与NI的转化关系
未来,随着脑启发算法工程实践积累和迭代,朱森华预计在3-5年后完成深度学习算法范式更迭,彻底走向脑启发的技术范式。
“人类的大脑是世界上唯一实现的最强具身智能大脑,我们没有理由不以它为蓝本进行技术迭代呢?”,朱森华表示。
这并不是朱森华的一家之言。在具身智能的架构设计中借鉴“人”,也是近期行业一大风向。
比如,前meta首席科学家、图灵奖得主杨立昆(Yann Lecun)近期就向行业发出提醒,现有的LLM架构是通往AGI的“死胡同”。他认为,AI应该向人类一样学习,构建内部的“世界模型”。
让具身智能学习人,难度要比以前更进一步,这要求设计者既懂AI和计算机,又了解人脑神经机制。而朱森华正是这样的稀缺角色。
“万事具备”的另一面,是商业资源。
![]()
具脑磐石
朱森华告诉我们,「具脑磐石」已经和国内汽车零部件领域的龙头上市公司纽泰格、另一智能制造上市公司达成合作。他将公司战略定位为全球化,落地首站,他们选择了亚太地区的商业服务和工业场景。
朱森华判断,目前具身智能最大的矛盾在于,“半吊子”的具身机器人与人们过高期望之间的鸿沟。要落地,最难的是找到愿意为不够成熟的具身智能买单的客户。
在国内,“机器人完全替人”的商业模式短期内还没法大规模走通,而但不同于国内的是,国外发达国家面临的“事实性劳动力短缺”尤为严重。
以日本的便利店为例,其核心竞争力之一是在提供7×24小时服务,而当下日本店员的老龄化严重、劳动力供给不足,制约了这一服务模式。在便利店夜班场景里,为了正常的服务运转,具身机器人便能发挥作用,承担起夜间值守、门店理货等基础性工作。
朱森华表示,在人力客观供给不足的情况下,客户就愿意为当下仅有六七十分能力的具身机器人付费,况且,机器人也在保持持续进化。
以下是《智能涌现》与朱森华的交流记录:(略经摘编)
深度学习,“有多少人工,就有多少智能”
《智能涌现》:当前的具身智能技术范式并不收敛,你认为应该怎么分类?你们的路线又有什么差异化?
朱森华:AI或具身智能当前主要有三个大的技术范式——
①压缩即智能的联结主义深度学习范式(DNN),这也是当前LLM-based AI的主流范式,以OpenAI等为代表。
该范式下大致有Transformer和Diffusion两大技术方案。其中,快慢系统、分层、端到端,都只是这个技术范式下不同技术方案的排列组合或局部优化变种。
②Trial-and-Error的行为主义强化学习范式(RL),强调Learn from Experience(从经验中学习),以Richard Sutton(理查德·萨顿,强化学习奠基人、图灵奖得主)等为代表
③脑认知启发的Neural AI范式(Brain Inspired Neural AI),强调Learn from Neuroscience(从神经科学中学习),以杨立昆等为代表。
我们是属于第三类。
《智能涌现》:现在大多数具身智能厂商主流的技术方案是端到端、分层等,这些路线可能存在什么问题?
朱森华:这些技术方案整体上都继承了深度学习技术范式上限的约束,比如存在高数据、高功耗、低泛化性、低可解释性、低在线学习等难题。
这也是为什么这两年基于深度学习的大模型工程优化,确让局部应用体验更佳了,但却仍然难以大规模推广应用的原因。
你肯定听说过一句话,“有多少人工就有多少智能”。今天的大模型也不例外,只是领域众多玩家把大多数注意力放在了持续寻找如何更快捷、便宜地构建数据集的技术方案。
《智能涌现》:这些技术路线未来是否走向收敛,哪一种范式会胜出?
朱森华:我认为当今无论是AI还是具身智能,全人类已经进入一片没有确定答案的技术黑森林。每种技术主张的成熟周期不同,技术突破也再难线性预测。
在黑森林里,需要有众多路径分头探索,所以,对于任何一个技术团队而言,只要有清晰的技术主张和相匹配的人才投入,都值得被支持。
《智能涌现》:你们选择的脑认知启发路径,还有哪些厂商或者科学家在沿用?
朱森华:如果非要跟业界做个对标,我认为“具脑磐石”采用的脑启发具身智能,和图灵奖得主、meta前AI首席科学家杨立昆(Yann Lecun)的世界模型架构设计理念是高度一致的。
我们曾深入分析研究过:杨立昆的JEPA-based World Model的底层认知神经科学,指导极大地借鉴了“自由能最小原则”(Free Energy Principle,FEP),两者之间有众多理论概念相近。
另外,北京通研院朱松纯教授 “小数据、大任务” 的AI技术主张从根源上就是认知神经科学的理论。
朱教授认为,人类的大脑并不是通过“背诵海量数据”而学习,而是通过极少量的观察和尝试,就能快速建立对世界规律的理解。
(《智能涌现》注:FEP自由能由认知神经科学领域科学家Karl Friston提出,它指的是,任何活下来的系统都在不断减少对环境的预测错误,比如走路时,大脑会预测下一步地面在哪里,如果预测错了下次就会调整姿势,这个过程就是最小化自由能。)
机器人大脑,如何向人脑学习?
《智能涌现》:为什么你们要向人类大脑学习,进而对具身智能进行改造?
朱森华:具身智能的根本目标,是希望机器人可以像人一样。人类大脑就是世界上唯一实现的最强“具身智能大脑”,也是“人工智能”这个概念提出的起源,我们没有理由不以它为蓝本进行技术迭代。
所以我们主张的是,用清晰的脑启发思想去替代盲目的计算。
《智能涌现》:人脑有什么最值得机器人学习的部分,你们是从哪几个维度去升级?
朱森华:对具身机器人的能力而言,有关键的两个部分:操作技能和自主移动。
在“操作技能”的这个维度,以“教会机器人用杯子喝水”这一任务为例,大多数具身智能公司的做法是,用尽可能多种类的杯子去采集足量的数据,比如采集圆的、扁的、方的、蓝的、绿的、大的、小的......
当机器人见过足够多种类的数据,下次遇到没见过但类似的,机器人仍可能通过关联推理,完成喝水的动作,实现泛化能力。
但如果是人脑,你设想一下,在人类小的时候,家长并不需要这样无穷无尽的方式来教小孩,甚至把你扔到森林里,你还能把椰子壳当容器去取水喝,展现出更高维度的泛化能力。
所以,人脑智能的一大特性就有着强大的概念抽象能力,能够实现举一反三的小样本学习。
《智能涌现》:如何实现“自由移动”呢?
朱森华:在“自主移动”的维度,不管是现在的送餐机器人、扫地机器人,去到一个陌生的环境都有提前采集环境地图的环节。
但是人类并不需要这个过程,仅仅凭借眼睛感知的视觉认知,就可以指导人在从来没有到过的开放空间里自由行动。这是人脑智能的另一大特性,有强大的开放环境自由探索能力。
《智能涌现》:这两个部分你们是不是已经运用到了机器人领域了?
朱森华:我们已分别在开放环境的自由移动、脑启发小样本操作,开展了算法原型验证。
具体而言,在移动方面,我们基于“栅格和位置细胞模拟”的方式,搭建了类人认知地图(cognitive mapping)机制,让机器人实现跨室内外开放场景的自由探索,部署效率提升了40%。
小样本学习方面,我们验证的结果是,数据相较此前降低90%。未来也有望走出具身智能堆算力的“暴力美学”。
《智能涌现》:不堆算力是怎么做到的?
朱森华:大模型里有一个核心词叫注意力,Attention,朴素地借鉴了人类大脑的认知神经机制。但计算机收到的每一张图片,每一个像素点的权重都是一样的,所以就需要极其巨量的GPU算力。
但是人类每秒都在接受海量视觉信息,大脑却不会崩溃,是因为人脑注意力有重点的,能动态根据关注点,聚焦于局部信息。
比如我刚刚进门的时候,你只会关注我来没来,但是其他的信息你都忽略了。
人一天吃三顿饭补能,成人大脑的功耗也就25瓦,就能维持860亿神经元的运转。大脑通过注意力机制,极大减少了处理信息的代价,最后实现了低功耗。这也是机器人大脑未来需要借鉴的。
《智能涌现》:你们具体是怎么把人类的抽象思维和引进到机器人上的?
朱森华:我们在模型里引入了抽象概念表征Encoder来实现,引导和使得模型不再是Learn from Tokens,而是Learn from Concept(从概念中学习)。在具身智能领域里,我们也看到有团队采用了类似的技术方式。
(作者注:抽象概念表征Encoder,是一种从具体数据中自动提取并编码出核心抽象特征的神经网络模块)
智能涌现:怎么理解类人认知地图机制?
朱森华:我们把人脑中由视觉细胞、栅格细胞、位置细胞联合构成的“自由探索认知神经机制”,抽象成一套全新的算法架构,让机器人实现不需要提前预置环境地图,就可实现类人的自由探索。
《智能涌现》:VLA在一些场景里还是有用的,你们是直接抛弃VLA,直接用全新的技术范式做具身智能吗?
朱森华:我们认可VLA是可用的工具,只是局部不可用,所以我们会给他“外挂”做优化改造。比如VLA现在像是个五六岁的孩子不够高,我们会给他加一副增高鞋垫。
举个例子,你上了大学的时候就会发现,解一道“鸡兔同笼”的题,有无数种方程的解法,比如矩阵计算。但你在小学时,你只会假设法,没上过大学,就绝对想不到有别的方法来解决。
今天计算机科学的人,大部分人不知道脑和类脑科学是什么,但是我们能从更高维解决具身智能问题。
具体路径上,在 1-3 年内,我们还是会基于VLA的工程实践,但是会用一系列认知神经机制,对具身智能的各个环节进行系统性的优化改造。
随着我们系统性的脑启发算法迭代,预计3-5年后更迭掉深度学习范式。
《智能涌现》:这种范式的差异,会产生方法论上的差异化吗,比如数据上的不同?
朱森华:我们的具身大脑要解决的问题,和其它玩家是没区别的,都是想让机器人能像人一样游刃有余地应对开放世界环境下的任务。
我们跟其他家最大的不同,在于“指导理论”根基不同。我们的指导理论来自系统性的认知神经科学,而非大模型堆砌Scale的算法工程实验。
数据方面,我们的数据需求跟行业一致,也是VLA真机数据。但随着AI算法范式的升级,所需的数据结构与数据标注未来也会动态变化。
《智能涌现》:你觉得现在具身智能领域,或者深度学习领域在技术上最大的痛点是什么?
朱森华:这个问题业界其实都非常清楚,就是缺乏系统性的清晰理论指导。我们回望Hinton引爆的深度学习发展这十年,大家都笑称模型训练是门玄学。
这个领域的工程师经常会说一句话,“我得回去炼丹了”。深度学习模型训练就是炼丹,没有明确的配方,大家都是试一试,今天你用10B的,明天他用30B的,最后业界汇总发现100B开始的模型才可以。
深度学习的发展过程中,怎么样堆数据、怎么样搭网络结构、怎么样定义优化函数,全靠算法工程师的“试错经验”来推动演化。
《智能涌现》:那脑认知启发的范式有理论指导吗?
朱森华:我们的指导理论来自认知神经学。现在全世界的科学家都在试图理解大脑的神经机制。以中国自2021年起、10年投入500亿的“中国脑计划”为例,核心研究目标被概括为“一体两翼”。
一体,是研究大脑的宏观、介观、微观结构与神经机制。左翼,是医学临床应用,用于指导临床帕金森在内的脑疾病治疗与大脑保护;
右翼,是类脑转化,用于指导把大脑结构与智能的优秀特性转化成服务于人类应用的计算机技术。
《智能涌现》:用脑认知启发来改造机器人,背后的难点在哪里?
朱森华:首先,在人类大脑研究这件事情上,研究还是相对缓慢的,受限于人类的物理学水平。因为我们不能用失活、异常的大脑去研究大脑的功能神经机制,所以科学家们发明了核磁共振(MRI)等工具去研究正常人类的活体大脑。
其次,大脑的智能(NI)和人工智能(AI)之间正在互相促进的。大脑的神经机制研究能启发算法,算法逐步的进步又能够加速大脑研究的进展。
但背后最难的是,我的算法该怎么设计、优化与迭代?站在脑与类脑研究的视角,领域里脑科学的人才相比于计算机人才很少,而能同时懂计算机科学,又懂脑科学的专家就更是稀缺。
具身智能落地,无法绕开的矛盾
《智能涌现》:你们现在会怎么落地自己的机器人?
朱森华:当前具身智能产业最大的矛盾是,半吊子的具身智能能力,与人们过高期望之间的Gap。
而机器人产业落地最困难的点是,如何为当前半吊子的具身智能能力,找到合适的场景和愿意为之付费的客户。
短期内,在国内,具身智能“机器人完全替人”的商业模式还没法大规模走通,客户算不过账来。
我们从成立的第一天,就立足出海去解决发达国家和地区“事实性劳动力短缺”的核心问题,包括商服、工业、康养等主要场景。
《智能涌现》:为什么出海的第一站会选择亚太地区?
朱森华:①亚太地区离中国近、有地理优势,有一定的文化相近性;
②亚太发达地区的市场规范、商业标准能对接欧美地区。
③亚太地区的发达国家不但人力成本更高,更是陷入了事实性劳动力短缺的情况。
比如像日本的7-11,由于全民老龄化导致严重的劳动力不足,核心的7×24小时服务模式难以持续,因此已经有一定数量门店缩减为16-20h的运营时间,减少夜班班次。而具身机器人如果能在店里完成夜间班次的巡店、理货、导购等工作内容,就可以让整个服务可持续。
目前已经有不少海外客户向我们明确表示,愿意为仅能替代人类50-70%的具身能力买单。
《智能涌现》:这几个月实际推动落地下来,发现机器人落地有哪些难点?
朱森华:从实验室技术到客户应用,中间需要应对很多变化,比如环境变化、人员操作、机器磨损等异常带来的种种corner case。
对客户场景的理解、技术原型的提炼,是坐在实验室想不明白的。产业化和商业化是个系统工程,需要干好脏活累活,而不是不切实际活在技术愿景里。
《智能涌现》:corner case有没有一些例子?
朱森华:举个例子,实验室的不透明格挡环境内可用的大脑模型,到了有玻璃墙、反光条的工厂环境,就会变得极不可靠。
《智能涌现》:很多具身智能公司都在“补脑”,本体厂商也在“补本体”,为什么你们坚持不做本体只做脑?
朱森华:我们希望通过聚焦大脑技术,攻克具身大脑“一脑多机”、“一脑多形”的能力上限。
每个团队都有自己的核心基因,眉毛胡子一把抓,要么有足够豪华的钱和凝聚力去做好软硬件人才储备,否则就会不聚焦、精力耗散。
《智能涌现》:但是现在具身智能行业里,似乎软硬的界限在逐渐模糊?
朱森华:我并不认同这个说法。大家有这种观感,主要原因是现在具身大脑算法还很难做到“一脑多机”、 “一脑多形”,导致大家都是在做“特定本体+特定技能大脑”的强绑定交付,很难解耦和泛化迁移。
这种形态很明显不会是最终的技术交付形态,因为它产品分工不够明确,也没有能体现具身大脑的能力。
《智能涌现》:你们直到2025年下半年才开启创业,会不会太晚了?
朱森华:坦诚地说,从融资拿热钱的角度来看,确实偏晚了,但是从产业化落地的角度来看,整个具身智能产业才刚刚开始。
封面来源|视觉中国
end
end





京公网安备 11011402013531号