要机器人真正帮助人类干活,最重要的能力是什么?
到底是逼真的脸,还是能跳舞的灵活四肢,这些,或许都不是重点。
因为真正的具身智能,不是用来表演的。
2025年,当行业还在为人形机器人跳舞流畅度、关节数量狂欢时,一家中国公司带着身怀绝技的咖啡机器人,用最实用的方式,回应着行业对具身智能的狂热想象:
75秒做出一杯咖啡,±0.1mm的超精密机械臂,包括磨豆、萃取、拉花的全过程;
在盲测中,即便专业评委也无法分辨哪杯是国际级咖啡大师制作,哪杯是咖啡机器人制作;
三年时间,席卷15个国家、100多个城市,制作了超过400万杯咖啡。
这家由微信之父张小龙、小米联合创始人林斌、黎万强等大佬共同押注的科技公司,叫做影智XBOT,一举斩获“2025中国具身智能创新企业”的头衔。
作为影智XBOT的创始人,唐沐骨子里相当“离经叛道”:
行业把“像人”当智能标准,他坚持只做“有用的机器人”;当创业者信奉大厂光环=成功捷径,他偏要脱离庇佑,从零起步;资本追捧炫技概念,他偏要一头扎进最琐碎、最难搞定的商用场景。
这个在腾讯、小米各沉淀十年的中国最顶级产品经理之一,正用人生最后一次创业,践行着他的产品信条:
用第一性原理,看到终局。
如果想真正看懂人工智能时代,就不能只看热闹。
创业初期,唐沐面临一个关键抉择:具身智能的突破口到底在哪?
2022年左右,人形机器人是绝对的流量明星,融资额屡创新高。但唐沐在调研了无数工厂、餐厅后,得出了一个“反共识”结论:“人形机器人也许步子迈太大了,商用场景的垂直机器人才是真机会。”
他的判断基于两个核心逻辑:
一是场景适配性。在工厂里,机械臂的效率是人形机器人的10倍以上;在物流场景,轮式机器人的载重能力远超双足形态。这些非人形的机器,用最适配场景的形态,解决着最实际的问题。“人形不指向任何具体功能,就像扫地机器人的核心是扫地,而不是像人一样扫地”。
二是商业化可行性。人形机器人的成本高达百万级,且无明确盈利场景,而商用场景的机器人只要解决降本增效,就能快速落地。
最终,唐沐将目光锁定在咖啡赛道。这个选择并非偶然:数据显示,2023 年我国人均年咖啡消费量约为 16.74 杯,几乎是 2016 年的两倍;到 2024 年,这一数字已提升至 22.24 杯以上。
但连锁咖啡店普遍面临人工成本高、出餐效率低、口味不稳定的痛点,咖啡师因过度劳累引发的泼咖啡事件,更印证了行业的矛盾。
唐沐的产品定义很清晰:他想研发一款咖啡机器人,用机器人解决重复性的制作流程,让咖啡师从繁忙中解放出来,专注于服务与互动。
“我们要做的不是无人咖啡店,而是人机协同的效率工具。”
2022年,第一代XBOT咖啡机器人诞生,60万元的成本让它更像“概念产品”,甚至有朋友好言相劝唐沐“造机器人,不如转卖芯片更赚钱”。
但唐沐看到了另一种价值——在各类展会上,这台能拉花的机器人总能吸引大量人拍照打卡,它能自带话题,这是传统咖啡机没有的优势。
但三年时间,XBOT从初代机售价60万,二代机降至38万,Lite版直击20万元区间,价格降至三分之一的同时各项功能提升50%,实现了跨越式迭代。
影智XBOT成功出圈,唐沐也因此多了一个标签:具身智能商业机器人第一人。
挺过至暗时刻
冷静外表下的真狠人
其实唐沐的产品直觉,早在2003年加入腾讯时就已显露锋芒。
他是雷军、马化腾等大佬公认的,能把设计感和实用性结合最好的产品经理之一。
2003年加入腾讯,唐沐是腾讯用户研究与体验设计中心组建人,陪伴很多人长大的QQ表情、QQ秀就是唐沐的作品。很长一段时间,马化腾的QQ头像是唐沐所设计的厨师男。
2013年,唐沐加入小米,迎来了职业生涯的“智能硬件修行期”。
当时的路由器市场乱象丛生,复杂的设置流程让普通用户望而却步。他带着团队砍掉所有冗余功能,推出“一键联网”的小米路由器,成为小米智能家居生态的核心入口。而2017年推出的小爱智能音箱,更是以299元的定价掀翻行业桌子。
——这些看似微小的创新,藏着他始终不变的产品哲学:
“任何技术若不能落地为真产品,终会沦为风口的泡沫。”
多年后,当小米正值上升期时,就在雷军准备把更宽广的赛道交给唐沐时,这个深耕产品二十年的老兵却做出了意外决定——辞职创业。“我还是想干产品,不想偏离初心。”
拒绝大佬的庇佑,是需要勇气的。
而张小龙、黎万强等行业前辈的天使投资,并非看纯重“机器人”概念,更是认可他凡事落地的产品基因。唐沐的微信签名一直是“keep walking”,他说自己休假超三天就会恐慌,“停下来会觉得跟这个世界脱节”,这种停不下来的冲劲,推着他走出了舒适区。
创业之路,从来不是坦途。
2023年,特殊时期的市场寒冬叠加芯片短缺,影智XBOT遭遇了最艰难的现金流危机,公司账上的钱只够支撑三个月,融资遇冷、银行贷款无门。
那段时间,公司管理层集体降薪,两三个月不发薪酬,只保障基层员工的基本工资。但唐沐心里清楚,“不能拿团队的生存底线做考验”。他卖掉自己手中的小米股票,度过了最艰难的至暗时刻。
“创业之前,我觉得自己跟着pony、雷总干了二十年,什么大风大浪没见过。” 用唐沐自己的话形容,“直到自己当家,才懂柴米油盐贵,才懂大家说的创业像嚼碎玻璃不是矫情。”
真产品逻辑:
从咖啡机器人到“新形态”公司
唐沐认为,影智XBOT是“产品流公司,不是技术流,也不是营销流”。
什么是产品流?
产品流的核心,是在真实场景里解决真实需求。
咖啡机器人的破局,正是这种逻辑的极致体现。在技术上,他摒弃了堆参数的思路,选择“成熟技术集成创新”:机械臂用的是工厂已验证十年以上的成熟型号,避免了新技术的不确定性。
而难点双臂协同拉花,则通过动作捕捉+数据采集的务实方式突破:
影智自建了好莱坞级机器人视觉实验室,部署了11组摄像机与红外光标记点,全角度捕捉世界咖啡拉花冠军的双手动作路径。
这样一来,在积累了上百小时的视频数据之后,通过数字孪生技术将三维动作数据转译为机械臂智能规划路径,最终完美复刻人类顶级咖啡师的手部动作细节。
更关键的是异步双驱技术的突破,让两条机械臂同时制作两杯不同的咖啡,一杯热拿铁、一杯冰美式,双臂可以进行高度非对称的协同,互不干扰地同时制作两款完全不同的饮品。
这项创新让机器人的出杯效率提升一倍,早高峰时段每小时能制作30杯咖啡,远超人工极限。
在体验上,唐沐始终坚持顺应人性。
他发现用户对定制化的需求远超单纯的拉花,于是在机器人中嵌入咖啡大模型与视觉识别技术:用户上传照片,机器人能将图像转化为焦糖印花;通过情绪感知,还能根据用户状态推荐饮品。
唐沐毅然决定要给咖啡机器人加装43英寸的交互大屏与AI数字人多模态交互系统,不同的数字人咖啡师还被赋予不同的MBTI人格,支持多种语言和方言的实时交互。
“星巴克曾说把顾客当朋友,但现在很多咖啡店连熟客都认不出。”唐沐说,“我们可以用技术把这种体验找回来。”
如今的影智XBOT,早已不是单纯的咖啡机器人公司。依托具身智能的核心能力,团队既做面向B端的商用机器人,也做面向C端的消费级产品,比如能陪孩子写作业的学伴机器人。
唐沐讲了一个创业细节,公司规模始终保持在100人左右,却能创造出远超同等规模公司的产能,“AI 让一个人能顶过去三五个人,扁平化的管理让决策更快,这就是新形态公司的样子。”
这种高效结构,支撑着公司在多赛道快速破界。
做咖啡机器人积累的具身智能能力,成了可复用的基础模块—— 多模态交互、IOT 连接、视觉认知这些核心技术,既可以支撑B端商用机器人的迭代,也能快速适配C端消费产品。
这种聚焦核心能力、多点开花的模式,甚至打破了传统创业公司“要To B、要么To C” 的刻板边界。
强悍的迭代速度,也是新形态公司的核心竞争力。
唐沐信奉“早死早超生”的产品哲学,咖啡机器人从第一代到第三代,没有漫长的研发周期,而是小批量试产、快速收集市场反馈、即时优化。
换句话说,就是用短周期、小步快跑的迭代,替代一次性追求完美的研发。
“汽车行业能做百年迭代,但商用机器人没有前人经验,只能边做边改。”他举例,第一代咖啡机器人只生产了100台,第101台就开始迭代升级,100台到200台又是一个新版本,“用户的需求在一线,不是在实验室里,只有快速响应才能做出真产品”。
商用机器人不必追求万能,能解决一个具体问题就够了。
结 语:
“这是我人生最后一次创业,具身智能值得我再赌上10年。”
2025年,国务院政府工作报告将具身智能纳入未来产业,行业热度再创新高。但唐沐依然保持着清醒,他见过互联网、智能硬件、VR、AR 等一次次风口起落,深知资本爱听故事,但市场只认结果。
创业三年,唐沐身上多了些烟火气,少了些大厂高管的傲气。唐沐也意识到,自己不能再继续当一个“顶级产品经理”了。
如今的他,要从一个带头冲锋的人,慢慢变成公司的顶梁柱。
而用第一性原理看到终局,这就是唐沐的答案:在具身智能的赛道上,不搞噱头,不跟风潮,用一个能赚钱、能解决问题的产品,狠狠扎进市场的土壤里。
因为剥离所有概念包装,具身智能的终局从来不是长得像人,而是想人所想、解人所难。
唯有扎根真实需求的真产品,才能走到终局。
当机器人不再仅仅展示能力,而是落地干活,它离真正改变世界,就又进了一步。





京公网安备 11011402013531号