当前位置: 首页 » 资讯 » 新科技 » 正文

阿里、字节再加码具身,互联网大厂能给机器人带来什么想象?

IP属地 中国·北京 编辑:顾青青 机器人大讲堂 时间:2026-06-18 04:04:42

6月16日,阿里巴巴发布千问具身智能大模型Qwen-Robot系列,包含 VLA 操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav和世界模型 Qwen-RobotWorld三大模型。

这则消息引发的思考的是:手握数亿用户资源的互联网大厂,下场搞机器人就一定能成功吗?未必。

虽然他们从PC时代打到移动互联网时代,如今又在人工智能时代呼风唤雨,可具身智能的复杂程度和未知风险要多得多。

不过话说回来,互联网大厂要品牌有品牌,要技术有技术,要钱有钱,兴许能给具身智能行业带来新的期待。

比如,这次Qwen-Robot系列是千问大模型家族首个完整的具身智能模型系列——三个模型分别为机器人装上灵巧的手、认路的脚和会思考的大脑,既可单独部署,也能协同运转,让不同形态的机器人迈向真实落地有了可靠的“通用底座”。

与此同时,近期字节跳动的动作也不小,具身智能纳入核心业务,其多模态负责人周畅的管理范围再次扩大,缘由李航负责的Seed Robotics团队已向周畅汇报月余。

这就很有意思了,阿里、字节纷纷行动,这一切都意味着互联网大厂对具身智能的布局,日渐从技术围观正式转向产业下场。他们势必要从中分一杯羹。

互联网企业手握算法、数据、算力与场景优势,确实能给机器人产业带来新的迭代思路,但具身智能终归是硬件属性极强的硬科技赛道,核心零部件、商业化盈利等产业瓶颈,不会因大厂入场就自动消解。

而且这场跨界入局究竟能打开多大的想象空间,又会面临哪些难以逾越的现实关卡,值得整个行业深思。

01.

all in具身智能,大厂下场再加码

回过头来看6月16日阿里发布的这个模型,有点颇为当年华为不造车但要赋能车企的感觉,其逻辑是,阿里的具身智能大模型Qwen-Robot系列,或对解决机器人大脑不太聪明的痛点有所帮助。

我们可以这样来理解,目前大家熟悉的大语言模型,只能在数字世界里聊天、生成文字内容,具身智能则把这种能力延伸到了真实的物理世界。

考虑到全球具身智能行业,正处在从实验室研发走向真实场景商业化的关键节点,能不能在陌生环境里听懂指令、稳稳完成任务,是迈过这道坎的核心。所以Qwen-Robot针对大模型做了三类关键设计与训练,让模型能更好地听懂人话、感知三维空间、摸清物理规律,进而指挥机器人在现实里自主完成复杂操作、精准移动,哪怕从没接触过的任务也能应对。

阿里之外,字节也是不可忽略的因素,它对具身智能行业的影响,同样正在显化,长期以来,字节对机器人业务的升级,被外界视为战略级的重心倾斜。

不同于此前AI Lab下属团队的前沿探索定位,具身智能纳入核心业务后,相关团队可能拥有更多管理资源的具身智能业务线,可以得到更为完整的产品、研发、商业化权限,目标直指产业落地。

具体落地层面,字节的布局已经从实验室走向真实场景。算法侧,此前打磨的Robix视觉语言大模型完成多轮迭代,可实现机器人端的环境感知、物体识别与指令理解,为通用机器人打造智能大脑。

商业落地上,字节跳动也早已入局具身智能,已开发机器人累计产量超千台,研发团队已经扩充至目前百多人。目前字节跳动已经量产的机器人形态是轮式物流机器人,用途是在仓库、产线上运输包裹与零件,能自主学习、规划路线、移动到目的地。

当下的成就与字节多年来的布局有关,把时间线拉长来看,字节对机器人的投入早已铺垫多年,甚至或早于阿里。

2021年,字节 AI Lab 旗下的机器人团队推出楼宇服务机器人,用其在办公楼内送餐、送快递包裹;

2023年,字节推出豆包通用大模型,AI布局不断快速发展,让机器人有了更聪明的算法和其他智能技术支持。

也正是在种种举措下和底层技术迭代下,字节人形机器人也从幕后走向前台。

公开信息显示,在2023 年时,字节机器人团队已有约50人,2024年机器人团队FAE接近百人,其中AMR(移动机器人)团队人员占比2/3,通用具身智能占比1/3。

到了2024年10月,字节正式对外发布了第二代机器人大模型GR-2,成为字节在具身智能体领域尤为显眼的亮点。来自第三方研究机构的国泰君安认为,字节第二代机器人大模型GR-2,已经初步具备世界模型能力,在无序摆放物品的抓取上和关节行动的灵活度上表现出色。

直至当下新的组织架构调整,字节对具身智能的业务重视度更为明显,信号也更明确。

其实,互联网大厂的集体入场,必然会给机器人产业带来不一样的玩法与节奏。但这些互联网基因的优势,究竟能在多大程度上重塑这个传统制造业属性极强的行业,我们还需要放到产业逻辑里逐一拆解。

02.

互联网大厂能重塑机器人产业什么

坦率地讲,互联网大厂入局机器人赛道,核心优势并不在硬件制造本身,恰好可能在智能大脑、数据算力与场景闭环三个维度。这些能力击中了传统机器人产业的短板,有望给行业带来范式级的迭代升级。

我们列举一个最直观的改变,是通用智能大脑的迭代速度被大幅拉高,由于传统机器人大多走专用路线,每一个场景、每一类任务都要工程师单独编写控制程序,适配新场景的周期往往以月甚至以季度为单位。

互联网企业把大模型技术迁移到机器人领域,打造通用型的智能控制系统,靠视觉、语言、运动模型的协同就能快速适配新任务。

比如传统工业机器人要新增一类商品的分拣流程,从调试到落地至少需要三周时间;基于大模型的机器人方案,通过图像识别和自然语言指令就能快速识别新物件、规划新路径,整个适配周期可以压缩到数天,其迭代速度的差异,是互联网式敏捷开发对传统工业研发模式的降维。这个效率从当下大厂每隔几个月就要开一次发布会宣布进行大模型迭代的动作中,就能看出。

当然,来自数据与算力的双引擎加持或许更关键。机器人的通用智能离不开海量真实场景的数据训练,而这恰恰是互联网大厂的天然优势。

以美团为例,即时配送网络每天产生千万级的路径规划、环境交互数据,京东物流的仓储体系积累了海量物料搬运、堆叠分拣的场景数据;而字节跳动则拥有电商仓储、内容办公等多维度的物理场景数据。

这些来自真实世界的多模态数据,是训练机器人感知、决策、运动能力的核心燃料,传统机器人厂商受限于场景规模,很难积累同等量级的数据储备。再加上大厂自身的算力基建,可以支撑大规模模型训练与仿真测试,形成数据-算法-迭代的正向循环。

还有一点不可忽视,大厂的自带场景加速了规模化商用进程。对机器人企业来说,找场景、找客户是商业化最大的门槛。互联网大厂本身就有海量内部场景,可直接作为落地试验场。

例如,京东的物流机器人最先在自有亚洲一号仓落地验证,跑通效率和成本模型再对外商业化输出。字节的自主移动机器人(AMR,Autonomous Mobile Robot)也已拿下一些外部客户,如顺丰、比亚迪电子,在生产基地内运输零件与加工好的商品。

自有场景相当于自带了第一大客户和天然试验场,省去了漫长的商务拓展和信任建立周期,让技术迭代和商业验证可以同步推进,大幅缩短了从实验室到规模化落地的路径。

这些优势叠加在一起,确实能给机器人产业的智能化进程按下加速键。但产业发展有其自身的硬规律,互联网大厂的软件能力再强,也绕不开具身智能的底层硬件瓶颈。

03.

赛道现存核心瓶颈,大厂也难以规避

目前,业内还没有谁真的做出了具身大脑,即能让机器人真的完成大量通用任务,且足够可靠、稳定。因为现在的机器人是指令怎样就做怎样,它不会主动理解你,换个通俗地说话,当下具身智能产品没法进行“向上管理””主动作为”。

具身智能虽被视作下一代通用生产力终端,行业增长速度有目共睹,但赛道底层的核心瓶颈客观存在。这些源于工业制造基础的硬约束,不会因为互联网大厂的入场就快速消解,哪怕拥有算法和场景优势,大厂也同样要面对产业的现实难题。

毕竟热闹的增长背后,全行业都面临着共同的底层制约。

第一个绕不开的瓶颈是核心零部件的对外依赖。

客观而言,精密减速器、伺服电机、高端传感器等核心部件,至今仍是国内机器人产业的短板。以减速器为例,日本企业纳博特斯克、哈默纳科等占据全球七成以上的市场份额,国内产品在精度、寿命、可靠性上仍有明显差距。时下中端应用市场国产产品渗透率突破60%,更高端的还不行。

一台工业机器人中,仅减速器的成本就占到整机的三成左右,进口零部件不仅价格高,供货周期也不稳定,直接推高了整机成本,限制了规模化普及的速度。这个问题是全行业的共性痛点,互联网大厂可以优化算法、提升效率,却没法在短时间内补上几十年积累的精密制造差距,同样要接受供应链的现实约束。

另外一个现实难题是商业化盈利的长期性,具身智能赛道整体还处于投入期,研发投入大,落地场景碎片化,单一场景的复用率低,多数企业都还没跑通盈利模型。

人形机器人单台成本动辄数十万元,距离民用普及还有很远的距离,2025年宇树人形机器人出货量突破5500台(并非订单数量),这已经是全球最高水平,但距离真正的规模化量产还有很大差距 。

而且服务机器人受限于场景分散,很难靠标准化产品实现大规模盈利。大厂虽然资金储备充足,能扛过长期投入期,但也违背不了商业规律,同样要面对投入产出不对等的现实,没法像做互联网产品那样快速实现规模化盈利。

这也就意味着,互联网大厂虽然带着算法、数据、算力、场景等多重优势入场,但也只是赛道数百家玩家中的一员。移动互联网时代,大厂靠流量、算法和资本就能快速建立壁垒,形成赢家通吃的格局。

但具身智能是软硬深度结合的硬科技赛道,供应链、制造工艺、硬件可靠性的权重,丝毫不低于软件算法。传统机器人厂商在制造、行业理解、客户资源上的积累,也不是靠资本和算法就能快速超越的。互联网玩家可以加速行业的智能化进程,却很难复刻过去呼风唤雨的统治力。

好的一面是,阿里和字节等大厂的入局,既打开了互联网技术赋能机器人产业的想象空间,也印证了具身智能作为下一代计算平台的产业共识。

产业的演进从来都遵循自身的节奏,软件能力可以加速迭代,硬件基础却需要一步步沉淀。互联网大厂的加入会让赛道更热闹、迭代更快,却不会改变产业发展的底层逻辑。

大厂带来的新变量,最终能转化成多少产业价值,还要交给时间和市场来给出答案。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。