作 者:微澜
来 源:正和岛(ID:zhenghedao)
2025年,中国具身机器人赛道风起云涌。
从今年年初,宇树科技的机器人登上春晚,正式拉开了中国具身智能机器人元年的大幕;
到今年年底,整个具身智能机器人行业百花其放,涌现出大量的明星企业,智元、众擎、小鹏、优必选……
显然,具身智能机器人赛道正在成为未来最具想象力的赛道。
根据摩根士丹利全球具身AI团队在最新发布的《机器人年鉴》中预测,基准情形下,全球机器人硬件销售额将从2025年的约1000亿美元激增至2030年的5000亿美元,2040年达到9万亿美元,并在2050年攀升至25万亿美元。这一预测仅涵盖硬件销售,若加上软件服务、维护及供应链相关收入,市场规模可能成倍增长。
而今天,我们要分享的也正是一位当下机器人赛道炙手可热的创业明星——首形科技的创始人胡宇航。
大多数人可能都没太听说过这个名字,但是,在具身机器人微表情领域,胡宇航和他创立的首形科技正在成为行业最受关注的标的之一。
从2019年成为哥伦比亚大学的研究生,正式进入到机器人领域的研究,到2024年创立首形科技,2025年博士毕业,胡宇航用了短短6年时间。
而凭借着首形科技,胡宇航也正在具身智能机器人行业上演一段精彩的创业故事,仅仅用一年多时间就斩获5轮融资,受到蚂蚁集团、雷军创立的顺为资本、招商局创投等基金的追捧,某种程度上来说,胡宇航的创业征程才刚刚开始。
![]()
哥大博士,干出一家机器人微表情公司
1997年,胡宇航出生于福建泉州,2015年其考上厦门大学嘉庚学院的机电工程学院。
和大多数上大学的人不同,在大学期间展现了高度的规划性和自律性,这两种品质也让其成为了学校的风云人物:
连续八个学期专业排名第一,并成功考取全国CAD技能等级考试二级证书;
除了学业是一个典型的学霸,其在科技竞赛领域也屡获殊荣,拿下包括国家级奖项6次、省级奖项5次和校级奖项3次,同时还成功申请到多项个人专利;
此外,胡宇航还展露了创业的潜质,在大学期间他还参加了各类创业比赛,带领团队多次斩获金奖。
事实上,在胡宇航最初的预设中,其将会在大学毕业后成为一个创业者,但随着对当时国内创业形势的深入了解,以及在自己创业实践的过程中,胡宇航意识到,自己接触的平台比较小,只有拥有核心技术和人才,才能建立足够高的技术壁垒,最终才有创业成功的机会。
也因此,在大学期间其确立了到美国TOP30的大学留学目标。
为此,胡宇航硬生生将过去一直存在的英语短板给生啃了下来,他考了9次托福,4战GRE(美国研究生入学考试),在备考后期,胡宇航曾自我调侃,已经“学到入魔”:
“对任何娱乐都不感兴趣。骑车不走路是为了在路上少花一些时间;走路不骑车是因为走路时可以拿起手机刷单词。”
除了英语是出国留学的一个最大障碍石,胡宇航还需要去了解意向学校的课程、实验室、教授研究方向等,针对这些书写自己的申请文书。
为了备考成功,胡宇航甚至放弃了自己当时的创业项目,也放弃了诸多比赛。“很多人不理解,我为什么要放弃自己所擅长的,选择和自己最弱的英语死磕到底。但我清楚地知道,既然选择了就要坚持下去。”
也正是这份坚持和死磕,胡宇航最终成功拿下了哥大和加州大学圣地亚哥分校的研究生录取通知书,最终,胡宇航选择了哥伦比亚大学。
![]()
首形科技创始人胡宇航
2019年下半年,胡宇航正式踏上了前往哥大的留学之路,也就在这里,胡宇航与机器人正式结缘。
也就在2019年、2020年前后,人工智能研究开始突飞猛进,自然语言处理(NLP)和计算机视觉(CV)技术都得到了明显的发展。
“未来AI能更深层次地理解人类语言背后的含义,并结合多模态技术,如语音、图像、视频等信息,全面感知和分析人类的情绪。”胡宇航曾说道。
这其中,人类的大多数感官都集中在头部,人脸作为情绪和表达的聚焦点,是人与人之间最直接的连接方式。
在胡宇航看来,人类最伟大的能力并非冰冷的逻辑计算,而是丰富细腻的情感。一个有自然表情,能理解、传递情感的面孔,将赋予机器人“表达”这些人类体验的能力,让它真正融入我们的世界。
也因此,胡宇航踏上了研究人脸机器人的道路,从研究生到哥大博士生,基本每一天,胡宇航的大部分时间都在实验室和机器人待在一起。
而在求学期间,熬夜、失眠、焦虑是常态,他开始大量掉发甚至还起了荨麻疹。于是,为了缓解压力,他开始拍起了短视频,搞起了“抽象”。
2022年9月,胡宇航在抖音发布了第一个留学日记的视频,在一开始拍抖音时,他并没有打算做科技博主,而是选择了成为一个“美食博主”。
当时大多数关注他的粉丝,更多也是把他看作一个“抽象帅哥”,作为“电子陪读”,跟他一起“云读博”。
直到他发视频宣布先后拿下《科学—机器人学》《自然—机器智能》《NPJ—机器人学》等顶刊论文,粉丝们这才发现他是一位隐藏的科技大佬。
2024年6月,胡宇航重启了自己的创业之路,创立了首形科技,英文名是AheadForm,既象征着机器人的头部,也彰显他勇往直前的态度。
![]()
翻越“恐怖谷”
时间来到2025年5月,当时,胡宇航发布了一段机器人“苏醒”的视频。
视频中,一个皮肤白皙细腻的“女孩”睁开眼睛,打量周围的世界,胡宇航打了个响指,指了指镜头,“女孩”好奇地抬眸,眼波流转,神情困惑,仿佛真的有了生命。
视频播放量很快突破百万,引爆网络。
有人直接问能不能众筹,让自己能够成为原始股东;也有人赞叹其打造了机器人界的“缪斯”,通过高度仿真的面部和灵动表情在一定程度上打破了“恐怖谷效应”,营造出了无限接近真人的外观和互动效果,而这也正是视频爆火的原因。
客观上讲,由于拟人捏脸技术仍在早期阶段,不少人会因为“恐怖谷效应”而对仿生机器人敬而远之。
什么是恐怖谷效应?
其由日本机器人专家森政弘提出,当机器人的外挂和动作接近人类,但仍有微小差异如僵硬的表情、不自然的瞳孔时,人类会产生强烈的不适感,也只有相似度超过某个临界点时,恐惧感才会下降。
![]()
图源:网络
这种现象可以用一个曲线图来表示:横轴是物体的类人化程度,纵轴是人类对该物体的亲近感。当类人化程度接近100%时,亲近感会再次上升,但在接近的过程中,会形成一个明显的“谷底”,这就是“恐怖谷”。
早在2016年,国外的汉森机器人就推出仿生人形机器人索菲亚,她的拟人性不仅来自以假乱真的橡胶皮肤与超62种微表情,更源于一套精密协同的“感知—认知—表达”闭环系统,通过面部识别与眼神交互,让每一次对话都自然流畅。但也正是这种过于逼真却又非人的特质,触发了人们心底的“恐怖谷效应”。
而在“恐怖谷效应”的背后,更核心的问题是技术上的不成熟。
“如果我们有更好的技术和工程体系,就有可能解决恐怖谷效应。”在胡宇航看来,很少有人会害怕蜡像、雕塑、手办,因为已经足够逼真,“只要将机器人原本僵硬的动作变得丝滑、协调,就能大大减少人心中的恐惧”。
要解决这个问题,首先也是最关键的一点就是算法。
在传统机器人领域中,关于仿生非线性的研究几乎一片空白,无论是机械臂,还是四足机器人,动作大多依靠程序的指令,像个“提线娃娃”,呆板僵硬。
因此,要想动作流畅,机器人需要学会做表情。但光凭互联网数据的训练,机器人并不知道做出的表情是否自然。
为此,胡宇航和首形科技,自研了情绪基座模型,通过融合语言、表情、语音、语境等多模态信息,使机器人能够理解和表达情绪。这不仅为当前的对话大模型提供了情感延伸能力,也为未来的具身智能提供了“情绪引擎”。
这里还值得一提的是,关于这个情绪基座模型的诞生,还有一个小插曲,当时苦于数据的不足,胡宇航突发奇想到了机器人可以尝试对镜学习。
于是,胡宇航把一面镜子放到人脸机器人的面前。通过眼睛里的摄像头,机器人能将电机指令和脸部表情相对应,汇总给AI模型,再对照互联网数据,解读不同表情的意义,构建起语音、语义、表情间的联系,这才有了首形科技情绪基座模型的雏形。
其次,算法解决了,还要解决物理世界的问题。由于人脸是无数微动作的耦合,为了让人脸机器人更加逼真,必须在柔软、非线性的硅胶皮肤内塞进更多电机,以实现精准调控,同时不能破坏面部结构。
作为一个极其小众又专业门槛极高的交叉领域,机器人人脸的表情理解和控制涉及了大量医学、工程知识,要找一个对机器人感兴趣的医学生,或者找一个有医学背景的工程师,都无比困难。
找不到同行者,胡宇航就决定自己独自前行。没有参考文献,没有工程先例,从算法、模型的开发,到实物的搭建、调优,全靠他一个人。
他经常一个人窝在实验室,3D打印出零部件,跑代码、建模型、搭实物,光是废弃的“脸皮”就塞满了一整箱,失败了几十次后,他多了两个“搭子”——“冷酷”和“冷漠”,一个登上了《科学-机器人学》,一个参与了科幻电影Posthuman的拍摄。
![]()
“冷酷”与“冷漠”,图源:U航视频
2025年6月,28岁的胡宇航从哥伦比亚大学博士毕业。此时的他,已经兼具多个耀眼的光环:
拥有上百万粉丝的科技博主;手握数篇顶级期刊的哥大博士,以及首形科技的创始人……
不仅如此,其创立的首形科技更是在一年多的时间里面狂揽5轮融资。在9月份的亿元级融资引发蚂蚁集团、招商局创投、顺为资本等的激烈竞争后,12月份,首形科技再获新一轮融资,由中国互联网投资基金(中网投)与蚂蚁集团联合领投,其他投资人包括上海未来产业基金、东方富海,老股东招商局创投持续超额追投。
![]()
图源:天眼查
事实上,当AI从工具演化为类人智能体,无数人应该都会产生一个好奇,它应当以怎样的物理形态存在于人类世界?
而人形面部的情绪表达,其实承载着具身智能跨出关键一步的可能性:它不仅影响“看起来像不像人”,更决定了AI能否在真实世界中建立稳定的交互心智、触达更高维度的体验层。
某种程度上来说,从眼神到表情,从口型到微动作,这些看似细小的“类人线索”,本质上是未来智能体能否成为可信赖的交互主体的基础设施。
也正如胡宇航在视频中所期待的:让人工智能和机器人不再是冰冷的工具,而是具备身体,自我认知与情感共鸣的新物种。
![]()
人脸机器人“Emo”,图源:U航视频
![]()
具身智能时代,中国创业者们百花齐放
“感谢大家的持久陪伴和宝贵建议,和我一起让机器人拥有表情,理解情绪越来越接近生命体,你们不是看客,而是这个旅途中的同行者。”
2025年7月份,站在WAAIC的聚焦灯下,在机器人领域已摸索了5、6年的胡宇航仍保持着激情和谦逊。
对于胡宇航来说,在探索人工智能和机器人的路上,新的征程才刚刚开始。
而对于中国具身机器人产业而言,胡宇航与首形科技的崛起,无疑也是中国具身智能时代的一个缩影。
它标志着中国创业者们,正从以往的技术跟随与应用创新,迈向前沿基础研究与核心体验定义的“无人区”。
过去很长一段时间,中国科技创业的经典叙事是“Copy to China”,即在成熟的商业模式或技术路径上,结合本土市场进行快速迭代与规模化应用。然而,在具身智能——这个融合了人工智能、精密机械、材料科学、认知心理学等多学科的赛道,规则正在被改写。
除了首形科技,中国具身机器人赛道正在呈现出“百花齐放”的繁荣景象:
宇树科技的通用人形机器人以高动态运动控制能力惊艳春晚,智元机器人瞄准工业生产场景推动商业化落地,优必选在大型仿人服务机器人及教育领域持续深耕,小鹏等车企凭借在智能驾驶中积累的感知与控制能力跨界入局……
而在“百花齐放”的背后离不开几点关键因素:
1.全产业链与极致工程化能力。中国拥有全球最完整、响应最快的机器人供应链体系。从无框力矩电机、谐波减速器,到各类传感器、结构件,创业者能够以极低的成本和极快的速度进行原型迭代。
2.超大规模市场与丰富的应用场景。从工业制造到家庭服务,从医疗康复到教育培训,中国复杂多元的经济社会结构,为具身机器人提供了海量的潜在应用场景和试错空间。这不仅吸引了资本,更让技术能在真实的反馈闭环中持续进化。
3.活跃的资本与投资者的参与。正如前文提到的,蚂蚁集团、顺为资本、招商局创投等兼具财务实力与产业生态资源的“聪明钱”纷纷重仓押注。它们带来的不仅是资金,更是对技术路线的背书、产业资源的对接以及对长期主义的耐心。这形成了一个“顶尖学术人才+风险投资+产业资本” 的黄金三角,加速了实验室技术向商业产品的转化。
4.一代“科学家创业者”的集体登场。以胡宇航为代表的科技创业者,是新一代中国创新者的缩影。他们通常拥有世界顶级的科研训练背景,在攻读学位期间就已触及领域前沿。这种“研而优则创”的模式,确保了创业公司的技术底蕴和创新锐度。
在1994年,张朝阳在他的第一份商业计划书——“中国在线”的封面上,写下来两句英文:“Riding the waves of our times,one is the coming of age of the information superhighway,another is the mergence of China as a global power.(顺应我们这个时代最伟大的两个潮流,一是信息高速公路时代的到来,另一个是中国作为全球大国的崛起)”那时,张朝阳还不知道自己的创业能做什么。
而当时间来到当下这个节点,三十余年后的今天,我们发现,以胡宇航、王兴兴等为代表的中国具身智能创业者们,正在以稳健的步伐书写一个关于“融合”的崭新故事。
我们也期待着,在百花齐放之后,中国具身智能产业能够孕育出引领下一个时代的参天大树。
参考文献:
[1].《给机器人做“脸”,28岁哥大博士收获百万粉丝》,科学网
[2].《为机器人“上妆”吸引百万粉丝!小伙登上世界AI舞台》,中国青年报
[3].《曾被100个投资人否决的人形项目,刚刚融资了!》,高工机器人
[4].《蚂蚁、锦秋、顺为、招商局创投联合出手》,首形科技
[5].《新时代“嘉”人 | 胡宇航:科创达人考上哥伦比亚大学研究生》,厦门大学嘉庚学院
[6].《抖音养成系学霸登上世界AI舞台,百万云股东现已就位》,抖音和ta的朋友们
排版| 小元
审校| 微澜轮值主编| 夏昆





京公网安备 11011402013531号