当前位置: 首页 » 资讯 » 新科技 » 正文

不做硬件做平台!腾讯七年磨一剑,开放具身智能能力赋能机器人

IP属地 中国·北京 编辑:陈阳 凤凰网科技 时间:2025-07-28 18:06:46

摘要:

“不用怀疑,机器人进家(这件事)有生之年肯定会发生的。”

科技 出品

作者|赵子坤

编辑|董雨晴

7月27日,腾讯 Robotics X 实验室与福田实验室联合发布具身智能开放平台 Tairos “钛螺丝”,这是国内首个以模块化的方式提供大模型、开发工具和数据服务的具身智能软件平台,通过“sdk/api”的方式面向机器人行业开放。

Tairos平台包含模型算法和云服务两大组成部分,模型层面包含了多模态感知模型、规划大模型以及感知行动联合大模型;云服务平台则包含了仿真平台、数据平台以及开发工具等,平台通过标准化接口调用及软件开发工具包(SDK)的方式对外提供服务。

当日,腾讯 Robotics X 实验室发布会现场,搭载了具身智能开放平台Tairos的宇树机器人G1走上台前,配合腾讯首席科学家、Robotics X 实验室主任、福田实验室主任张正友一起来做产品介绍。

在演讲的最后,张正友问身边的G1机器人,“结束后晚上要不要去喝一杯?”

它一板一眼回答:“不了,太忙了,今天还要加班。”

自动播放

当日下午,在接受科技在内的媒体采访时,张正友也对此回答感到惊讶,“之前的彩排它不是这么说的,每一遍跑的(回答)都不一样。”

这是腾讯Robotics X实验室成立7年,实验室负责人少有的接受对外公开采访。他依旧坚定认为,养老场景是最适合做技术探索的场景,“为什么选养老,这是一个很难人机交互场景,我们是想用比较难的场景去切入做技术研发。”

“不用怀疑,机器人进家(这件事)有生之年肯定会发生的。”张正友说。

在这个时间节点,腾讯拿出了此前积累的技术成果,做成具身平台开放对外。“与其说商业化,我们更乐于提产品化。商业化听起来,是要赚钱。我们不是以赚钱为目的的。我们希望把自己变成一个稳定的产品,推动全行业发展。”

但他也强调,研发不能被产品化压力带着跑,并打趣道,“如果当年马化腾先生让我成立一个机器人实验室,立马做产品,我可能就不会来了。”

面对近来的人才流失,张正友坦诚,“确实现在外面吸引力很大,但我们跟初创公司不太一样,非常支持年轻科研人员的前沿探索,这个(科研)环境,在中国是很难得的。”

面对行业内的“四足”和“双足”路线之争,张正友则强调,“我(之前)做机器狗,不是为了做机器狗,是为了长远的理念。”

在他看来,未来具身智能的实现不一定只有纯足式、轮式的形态。曾经,人类是为了适应原始环境进化成了“双足”,而在当下的人居环境中,双足的效率不一定最佳。仅考虑“人形”反而会限制机器人的未来发展可能。因此,腾讯探索足式人式一体化方案,把“轮”和“足”结合,应用到腾讯家居环境原型机器人“小五”上。

而相比于初创企业对具身智能行业“iPhone时刻将到来”的普遍乐观,张正友显得更加犹豫和谨慎。

“现在连距离所谓的‘大哥大’时代还有多远都不好说……但在安卓、iPhone出现之前,难道BlackBerry(黑莓手机)的‘失败’就是没有价值的吗?”

他希望,腾讯能够通过发布Tairos平台,加速行业进入“大哥大”时代。“无论是我们认为的养老场景,还是别家说的工业场景,无论怎么样,都希望助力大家尽快提高量产数量,把成本降下来,技术稳定下来。”

“如果(现在)机器人零件,比如头都掉了,还在跑,证明还不是真正的具身智能,但我相信,到明年的马拉松赛事,机器人就可以自己跑了,不需要人在后面遥控了。”

以下是张正友采访实录,经过不改原意的删改:

Q:早上演讲时您最后提到,唐代智通大师留下的四句偈语:“三身元我体,四智本心明。身智融无碍,应物任随形。” 2021年时,您说过说要翻译道德经,后来有翻译吗?像这种东方的哲学,对于机器人理念的设计上会有一些启发吗?

张正友:肯定会有启发的。演讲时我用了唐朝傅聪大师的一句话,身智融无碍,对吧。现在可能我们经常会看到有些演示,比方说,跑步的时候头掉了,这机器人还在跑,或者是手臂断了,还上去抓这个东西——你可以很明显感觉到,这不是具身智能。连自己自身的状态都没有感知的话,这机器人与我们想要的差很远的。身体跟智能要紧密结合,要和谐融合都是很重要的工作。

以前我提过,虚拟世界和真实世界要无缝的紧密结合,这个观点也有一点融合东方的思想。放在机器人,我们通过仿真训练就知道,到底执行会不会比较完善。如果想象出来和真实执行差的比较远,那么就要修正自己的规划。

《道德经》我翻译第四遍了,每翻译一遍重新看一遍,都有不同的启发。但我的目的不是为了出书,是为了提供自己不断提升的过程。

Q:今天看Tairos 发布,想到曾经其他大厂也做过类似的平台,想去支持车企,但最后在业界并没有那么成功,那现在腾讯做开放平台成功的可能性变大了吗,有什么地方不一样?

张正友:你这个担忧非常真实。往好的方向想就像Windows——它要涉及很多不同厂家的PC机,如果没有很好的兼容,到最后是不可能发展起来的。

我们从一开始就让开发平台跟好几家机器人客户厂家整体打磨,不是发布完就不管。今天你看到的小五机器人、越疆、帕西尼都搭载了平台。

Q:腾讯在具身智能大模型和云服务业务上相比其他平台的优势是什么?

张正友:一个是模块化,厂家可以选取他想要的模块。比如,感受模块,假如他自己的感知能力很强,就不需要我们这个模块;另一个是我们平台完整,包括左脑右脑小脑,同时允许接入第三方模型。但是这个模型需要经过具身智能特训——我们有套流程:从开源基础模型加上我们自己具身数据预训练的模型,厂家只需要用自己的东西少量数据就能快速适配,整个流程非常顺。

Q:腾讯说不做硬件,要做厂商的合作伙伴,最近收到合作伙伴主要需求是什么?现阶段,精力和资源会着重放在哪些能力提升上?

张正友:我们跑过全国北京、上海、深圳、成都等六十几家企业,发现中国大量机器人企业,硬件做得很好。腾讯在具身投入非常大,做了7年了,大家对我们做这个事是非常欢迎的。我们选高配合度种子企业深度打磨,7月平台标准化后开始铺量——这也是过往腾讯做产品的思路,一下子是不能铺太多的。

腾讯的重点优势就三个:模型能力(规划/感知/行动联合模型)、仿真环境、多模态感知。今天发布还是初版,后面随着更多企业参与,平台会打磨得更好。

Q:机器人落地目前最急需补足的技术是什么?

张正友:核心是对三维世界的可操作认知。现在很多“世界模型”建个咖啡杯3D模型,你可以在里面动来动去看起来很漂亮——但机器人是需要真实把它抓起来。他们建的模型是全部连在一起的,这和我们需要的可操作模型有根本区别。

规划方面,大语言模型是通过文本理解世界,但很多文字是描述不清楚的。动物没文字语言也能在3D世界活下来,证明非语言认知很重要。

触觉传感器从成立之初我们研究了7年,现在还没达到真正标准化。

Q:腾讯 Robotics X 实验室的商业化目标此前比较谨慎,之后态度会不会有所改变?

张正友:我们7年前成立时,就没有任何商业化路径。当时必须从头做,既做硬件又做软件,从2023年下半年开始,行业就有很大变化,很多机器人厂商出现。

现在形势已经变化了。腾讯需要跟机器人硬件本体厂家一起,把具身智能技术,跟本体厂家一起去打磨,否则就是停留实验室前沿探索。当然探索还会继续,但有些能力希望跟本体厂家一起去打磨技术。

与其说商业化,其实更乐于提产品化。商业化听起来是,要赚钱。我们不是以赚钱为目的的。我们希望变成一个比较稳定的产品,来赋能机器人行业。

Q:既然要做机器人厂商的合作伙伴,腾讯之后是不是不会再做机器人产品了?

张正友:我们从来不做产品,都是研究原型。“小五”也不是产品。

最早我们的机器人其实是更先进的,腿轮一体的探索移动形态创新——为什么非要用腿?平地上轮子效率高得多。后面做的调酒机器人,是验证触觉技术,养老机器人研发人机交互安全性。这些原型验证完技术我们就继续推进前沿,不会停在产品化和商业化。

现在Tairos 平台发布后,还会继续做一些反思性的研究性的硬件——因为硬件软件完全脱节效果不好。

Q:你们选择做什么,不做什么,决策逻辑是怎么样的?

张正友:从我个人角度,还有更大目标在支撑着。为了实现未来的养老场景,我们要继续推进机器人的智能和本体里的核心技术,比如初级测量器定制皮肤这些能力。

我加入腾讯的时候,规划的是十年。现在已经7年了,也许差不多3年后,就能实现。假如我一开始就只潜心在机器狗上,后面就没精力研究其他了。既定目标是很宏伟的,要沿着这个目标继续前行。

Q:从时间轴上,现在具身智能处在哪个阶段?

张正友:这是一个探索的过程。比方说,以前BlackBerry(黑莓手机)是失败了,但是没有那个过程,后面怎么会出现像iPhone这些设计出来?对于我来讲,本体的探索是需要要投入进去,必须要投入进去。

Q:怎么评价当下火热的机器人赛事?

张正友:赛事还是一个很重要的推动力,能够推动技术往前。就像大模型,大家都可以去尝试。

但比如说,现在一些机器人脑袋掉了还得跑,说明这个技术是没用的,它没有感知能力,对吧?你就不会去关注某个厂家,仅仅是为了比赛而赛。从我们真正的技术研究角度和行业发展角度讲,还是希望这些比赛提升整个具身赛道真正的能力,还是有帮助,但我们自己可能不太会参加。

现在马拉松,我们看到的是人在后面遥控,因为感知模型不够,只是这个技术还没到时候。我相信可能明年就能做到了,机器人能自主跑起来。

Q:为什么不做双足机器人?

张正友:我不是对双足机器人有什么“仇恨”。双足人行这个形态已经在那里了,你不需要花更大精力去思考,只是去控制它就行了,这是其中一个思路。另外一个思路就是有好几个可能性。

双足,是人在几千万年进化过程中,为了适应复杂环境进化出来的。但现在是人居环境,实际上双足效率很低。我们想探索的,既有轮子又有腿,想看看有没有更好的形态,适合人居环境。

假如我们人形机器人行作为标准,这其实是限制了我们对机器人的想象力。比如说,人不能进化出屏幕,但技术可以。如果仅用自然语言交互,会被速度限制。

假如机器人是一个屏幕,信息呈现在屏幕上,人类读取信息的效率提升了三倍。那为什么一定要用语言去对话呢?

我不是简单否认双足形态,而是有很多其他形态可以去探索。

Q:成立7年,中间应该也有过一些阶段性成果,现在这个时间点,是怎么判断可以商业化了?

张正友:现在这个时间点跟行业发展有关系。上一个阶段,大家都还是在做工业机器人。2023年开始,具身智能火热,大量本体公司出现,能用上。更多是来自市场和产品的需求。

我们也不会放弃前沿技术,假如如果探索停半年,也许感知模型、规划模型就落后了。现在前进的大方向,跟我七年前的判断,几乎是没有变化的。

当初也没想那么多,只是在考虑研究前沿技术。研究人员不能被产品化引导,技术是不能被产品化引导的。7年前,如果马化腾先生让我来成立机器人实验室,马上做个产品,我就不会来了。

今天上台签约的厂商,很多也不是腾讯投资的,我们是要支持整个机器人行业发展。目前机器人行业离iPhone时刻还有很大的距离。怎么让整个生态起来,是最重要的问题。

Q:您刚才提到,腾讯对实验室的耐心还很多,但我们看到前两年各大厂都在做AI lab,都陆续做不下去,你们会有担忧吗?怎么看当下一些人才的流失情况?

张正友:外面的吸引力很大,好处是仍然有很多同学留下来,更多新鲜企业补充进来。我们跟初创公司不太一样,支持力度对年轻研究人员很大,希望深度探索。这个环境是很难得。

现在大部分做数据采集,做科研,做导览。利用这个平台,助力行业进入大哥大时代。应该是养老场景比较适合的。也有人认为是工业场景。不管是哪儿,场景要足够大。

Q:做得早,或者做得晚都不一定是成功的,你们在具身智能中的节奏和战略是什么样的?

张正友:我之前做机器狗不是为了做机器狗,是为了长远的理念,为了运动能力。不一定做足式或者轮式,我们是想探索新的方案,足式轮式一体化,是很大的创新。

腿和人结合,应用到机器人小五上。走楼梯,是足式。平地是人式的。我们要跳出一般的平常人的思考方式,去想有没有更合理高效的一个技术方向。

我们做得很早,现在有些能力能够支持行业发展,所以就开放出来,但现在还是初级阶段,还有很长的路要走。

Q:怎么看待行业过热的情况?

张正友:从技术角度讲,更多的企业和研究单位参与进来,这都是好事情。行业就发展的会越来越快。但假如说,是不是有些企业会技术不够成熟,到最后倒闭了,任何一个技术在发展过程中都有这个可能。

标签: 机器人 模型 智能 张正友 腾讯 平台 技术 行业 硬件 实验室 企业 能力 规划 本体 厂家 环境 产品 大师 语言 足式 商业化 形态 厂商 产品化 养老 本心 大量 紧密结合 磨一剑 角度 场景

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。