机器人AI世代来了，谷歌推出新Gemini模型，可在本地运行

IP属地中国·北京 编辑：钟景轩 ITheat热点科技 时间：2025-06-25 20:17:48

今年三月，谷歌推出了Gemini Robotics的“视觉语言动作”（VLA）模型，近日，他们再次推出该模型的升级版，名为Gemini Robotics On-Device。
根据谷歌的介绍，该模型是他们最强大的VLA模型，经过优化后，可在机器人设备上本地运行。
谷歌DeepMind高级总监兼机器人主管透露，“该模型独立于数据网络运行，因此它对延迟敏感的应用很有帮助，并确保在间歇性断网或无网络连接的环境中，依旧稳定运行。”
另外，谷歌明确表示，Gemini Robotics On-Device是基于3月份推出的Gemini Robotics升级改进而来，专为“双臂机器人”而设计，旨在提高灵巧应对复杂任务的适应能力。
在此前的一次演示中，该团队展示了运行这种本地模型的机器人，它们可以轻松执行拉开拉链和折叠衣服等基本动作。
谷歌表示，虽然该模型是为ALOHA机器人而训练，但后来他们对其进行了调整，使其适用于双臂Franka FR3机器人和Apollo人形机器人。
与此同时，谷歌DeepMind还发布了Gemini Robotics SDK。该公司表示，开发人员可以在MuJoCo高级物理模拟器上使用这些模型，允许向机器人展示50到100个任务演示，以训练它们完成任务。
相比单纯的“大语言模型”，这些机器人AI需要面对更多问题，因为机器人不仅存在于物理世界中，还会改变其环境。谷歌DeepMind机器人技术负责人表示，“Gemini能够生成文本、写诗、总结一篇文章，甚至编写代码，现在，它还可以生成机器人动作。”也就是说，谷歌认为他们的机器人模型已经可以通过大数据训练各种动作，在快速迭代中面对各种物理世界的问题。
另一个担忧是，相比对话型AI，这种机器人AI更需要关注安全问题，毕竟“终结者”这种恐怖桥段更容易成为现实。谷歌方面表示，为了保障Gemini Robotics的安全，他们采用了多层限制的办法。具体来说，控制机器人的是一个底层VLA模型，在其之上还有一个VLA上级模型，该上级模型用推理模型的方案来判断什么指令是安全的。简而言之，用“AI管理AI”的方式来确保安全。
毫无疑问，机器人AI又是一个新赛道，包括Nvidia在内的很多公司都在秘密研究自己的机器人项目，相信国内也有很多企业在这条赛道上默默前行，让我们拭目以待新一场AI大战的揭幕吧。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

【新书】《生命传》：基因不是答案，而是问题的开始

“飞天”健身器上天！青岛英派斯为航天员健康护航

空客最畅销窄体客机首次在中国进行高难度机身系统装配

向新而行·育见未来丨武汉：打造人形机器人完整生态体系为全球具身智能发展提供 “武汉方案”

宇树科技王兴兴亮相国新办：未来3至5年，人形机器人应用将加速

机器人共舞“智”造“新”时刻

全站最新

颜值天花板！OPPO A6s Pro三色设计公布配色名寓意太好了

8GB显卡再战十年不是吹牛！NVIDIA RTX神经纹理压缩技术实测：显存占用爆降85%

小米汽车答网友问（第234集）发布

小米REDMI R70m / R70 5G手机现身中国电信终端产品库

热门推荐

【新书】《生命传》：基因不是答案，而是问题的开始

“飞天”健身器上天！青岛英派斯为航天员健康护航

空客最畅销窄体客机首次在中国进行高难度机身系统装配

向新而行·育见未来丨武汉：打造人形机器人完整生态体系为全球具身智能发展提供 “武汉方案”

宇树科技王兴兴亮相国新办：未来3至5年，人形机器人应用将加速

机器人共舞“智”造“新”时刻

黄仁勋：中国有非常独特的优势发展人形机器人

迎接下一个AI浪潮，近千只机器人概念股集体“躁动”

武汉市力争2027年人形机器人产业规模超100亿元

对话 | 做“金字塔尖”的手术机器人

“传递能量方块”开启！未来一个月机器人将在北京街头“快闪”

聚焦人形机器人关键领域开展技术创新，多位湖北省政协委员建言科技创新和产业创新融合发展

古人发明的3大“奇技淫巧”，有的物件，放到现在仍算是高科技

《疫苗冷链上链：99.6%合规率背后的物联网+区块链融合》

折叠屏手机选购指南：这三款旗舰让你一手掌握未来科技