“腾讯希望和所有机器人公司合作,做机器人的外脑。”
7月27日,腾讯Robotics X实验室与福田实验室联合发布具身智能开放平台Tairos“钛螺丝”,这是国内首个以模块化的方式提供大模型、开发工具和数据服务的具身智能软件平台,通过即插即用的方式面向机器人行业开放。
Tairos平台包含模型算法和云服务两大组成部分,模型层面包含了多模态感知模型、规划大模型以及感知行动联合大模型;云服务平台则包含了仿真平台、数据平台以及开发工具等,平台通过标准化接口调用及软件开发工具包(SDK)的方式对外提供服务。
腾讯首席科学家、RoboticsX实验室主任、福田实验室主任张正友表示,Tairos具身智能平台致力于为机器人本体与应用开发商补齐关键软件能力,如同为各类机器人装上“大脑”,使其具备感知世界、规划任务及自主决策等能力,从被动执行指令的机械体进化为能主动适应现实世界的智能生命体。
不做硬件,选择做外脑
在2025世界人工智能大会(WAIC 2025)腾讯论坛上,Tairos平台首批合作伙伴名单同步公布,越疆科技、乐聚机器人、帕西尼感知科技、擎朗智能、众擎机器人科技、宇树科技等多家机器人公司共同见证了平台发布。未来,Tairos平台不仅对所有机器人硬件公司开放合作,还将向各领域模型开放算法接入能力,让开发者可在平台上自由组合创新。
在WAIC的腾讯应用集市展区,越疆具身智能机器人X-Trainer就现场展示了“动动嘴就让机器人做好饭”的场景。据越疆科技相关负责人介绍,这是国内首个复杂长序列任务具身VLA应用落地,该机器人能与人自然对话、理解意图、感知环境状态,可拒绝不合理任务,并制定动作计划响应需求,实现双臂协同精细操作、闭环动作控制、实时纠正错误及及时响应最新规划任务。
越疆科技与腾讯联合开发的“机器人制作煲仔饭”
腾讯Robotics X机器人实验室成立于2018年,肩负着腾讯在机器人领域的前沿探索使命,曾推出多模态四足机器人Max、轮腿式机器人Ollie、自研三指/五指灵巧手TRX-Hand、自研机械臂TRX-Arm及人居环境机器人原型“小五”等,是国内少有的具备全栈机器人技术能力的团队。
张正友在接受媒体采访时表示,人形机器人的探索是必要过程,正如当年功能手机被淘汰后,才有了iPhone和安卓等创新产品。尽管目前可能尚未见到显著成果,但这类基础本体的探索对未来发展至关重要。“开放平台对技术发展意义重大,一个能与不同厂家良好兼容的优秀平台,将极大促进行业发展。目前腾讯正打造这样的开放平台,支持各类企业更高效地开发和应用机器人技术。”
上证报 操子怡 摄
加速开源生态布局
论坛上,腾讯还正式发布了混元3D世界模型1.0,并宣布全面开源。这是业界首个开源的可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来全新可能。
记者在现场看到,腾讯混元3D世界模型1.0融合全景视觉生成与分层3D重建技术,支持文字和图片输入,能生成高质量、风格多样的可漫游3D场景。过去需专业建模团队数周搭建的3D虚拟世界,如今只需一句文字或一张图片,几分钟内即可完成生成。
对游戏开发者而言,该模型大幅简化了3D场景构建流程。输入“一座中世纪城堡,城堡塔楼宏伟壮阔,周围有石头雕像、石铺路和美丽花朵,卡通风格”等简单指令,模型就能快速生成包含建筑、地形、植被的完整3D场景,输出的Mesh文件可用于游戏原型搭建或关卡设计,满足个性化创作需求。
对于无建模经验的普通用户,通过混元3D创作引擎,仅需一句话或一张图就能快速生成360°沉浸式视觉空间,生成的场景可无缝导入Vision Pro等虚拟头显,带来沉浸式体验。
据介绍,除本次发布即开源的混元3D世界模型1.0,混元还将在月底开源一系列小尺寸模型,包括0.5B、1.8B、4B、7B混合推理模型,更轻量且易于部署。此外,在LMArena Vision榜单拿下国内第一的多模态理解模型混元-large-vision,以及专为游戏场景优化的交互式游戏视频生成框架混元GameCraft等,也将于近期对外开源。
作者:操子怡 谭镕