当前位置: 首页 » 资讯 » 科技探索 » 正文

机器人AI世代来了,谷歌推出新Gemini模型,可在本地运行

IP属地 中国·北京 编辑:钟景轩 ITheat热点科技 时间:2025-06-25 20:17:48

今年三月,谷歌推出了Gemini Robotics的“视觉语言动作”(VLA)模型,近日,他们再次推出该模型的升级版,名为Gemini Robotics On-Device。

根据谷歌的介绍,该模型是他们最强大的VLA模型,经过优化后,可在机器人设备上本地运行。

谷歌DeepMind高级总监兼机器人主管透露,“该模型独立于数据网络运行,因此它对延迟敏感的应用很有帮助,并确保在间歇性断网或无网络连接的环境中,依旧稳定运行。”

另外,谷歌明确表示,Gemini Robotics On-Device是基于3月份推出的Gemini Robotics升级改进而来,专为“双臂机器人”而设计,旨在提高灵巧应对复杂任务的适应能力。

在此前的一次演示中,该团队展示了运行这种本地模型的机器人,它们可以轻松执行拉开拉链和折叠衣服等基本动作。

谷歌表示,虽然该模型是为ALOHA机器人而训练,但后来他们对其进行了调整,使其适用于双臂Franka FR3机器人和Apollo人形机器人。

与此同时,谷歌DeepMind还发布了Gemini Robotics SDK。该公司表示,开发人员可以在MuJoCo高级物理模拟器上使用这些模型,允许向机器人展示50到100个任务演示,以训练它们完成任务。

相比单纯的“大语言模型”,这些机器人AI需要面对更多问题,因为机器人不仅存在于物理世界中,还会改变其环境。谷歌DeepMind机器人技术负责人表示,“Gemini能够生成文本、写诗、总结一篇文章,甚至编写代码,现在,它还可以生成机器人动作。”也就是说,谷歌认为他们的机器人模型已经可以通过大数据训练各种动作,在快速迭代中面对各种物理世界的问题。

另一个担忧是,相比对话型AI,这种机器人AI更需要关注安全问题,毕竟“终结者”这种恐怖桥段更容易成为现实。谷歌方面表示,为了保障Gemini Robotics的安全,他们采用了多层限制的办法。具体来说,控制机器人的是一个底层VLA模型,在其之上还有一个VLA上级模型,该上级模型用推理模型的方案来判断什么指令是安全的。简而言之,用“AI管理AI”的方式来确保安全。

毫无疑问,机器人AI又是一个新赛道,包括Nvidia在内的很多公司都在秘密研究自己的机器人项目,相信国内也有很多企业在这条赛道上默默前行,让我们拭目以待新一场AI大战的揭幕吧。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。