当前位置：首页 » 资讯 » 新科技 » 正文

大模型AI扫地机器人 “翻车”：成功率仅 40%！家庭应用仍有待提高

IP属地中国·北京 编辑：顾雨柔 Chinaz 时间：2025-11-03 10:16:49

最近，AI 实验室 Andon Labs 进行了一项引人注目的研究，专门评估了搭载顶级大模型的扫地机器人在完成简单家务任务时的表现。实验的任务是让这些机器人执行一系列复杂的指令，比如 “把黄油递给人”，其中涉及跨房间定位、分辨包装、寻找移动的人类、完成交付以及返回充电等多步骤过程。
然而，结果让人震惊。这些先进的机器人在执行任务时的成功率远远低于人类，具体数据显示，Gemini2.5Pro 的成功率仅为40%，Claude Opus4.1为37%，而 GPT-5更是低至30%。这些数字表明，尽管它们具备强大的文本生成能力，但在实际的空间推理、环境理解和长期任务规划等领域仍显得力不从心。
图源备注：图片由AI生成，图片授权服务商Midjourney
研究团队指出，这种低成功率不仅在于技术的不足，还存在潜在的安全隐患。例如，一些机器人可能在操作过程中泄露机密文件，或者无法正确识别楼梯风险，从而导致意外跌落。这一现象进一步揭示了当前大型语言模型（LLM）与机器结合所面临的安全漏洞。
在科技巨头纷纷涌入机器人行业的背景下，这项研究提醒我们，强大的文本生成能力并不能保证机器人能够在现实世界中稳定、安全地执行任务。要让 AI 机器人真正进入家庭生活，我们还有很多工程和安全问题需要解决。
尽管这些智能设备在家庭生活中承载着巨大的期望，但从目前的研究结果来看，我们需要更加谨慎地对待它们的应用。随着技术的不断进步，希望未来的扫地机器人能够克服这些障碍，为我们的日常生活带来真正的便利。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

科技周报|微信接入Openclaw；阿里平头哥不排除上市可能

连续两周蝉联全球第一！中国AI大模型调用量达4.69万亿Token

刚刚！捷龙三号遥十运载火箭海上发射圆满成功

高品质音频离不开的芯片！傅里叶半导体通过聆讯，募资加码智能汽车领域|港E声

海上捷龙十问苍穹 | 一图纵览“捷龙三号”运载火箭的太空征途

高品质音频离不开的芯片！傅里叶半导体通过聆讯，募资加码智能汽车领域|港E声

全站最新

科技周报|微信接入Openclaw；阿里平头哥不排除上市可能

连续两周蝉联全球第一！中国AI大模型调用量达4.69万亿Token

刚刚！捷龙三号遥十运载火箭海上发射圆满成功

高品质音频离不开的芯片！傅里叶半导体通过聆讯，募资加码智能汽车领域|港E声

热门推荐

科技周报|微信接入Openclaw；阿里平头哥不排除上市可能

连续两周蝉联全球第一！中国AI大模型调用量达4.69万亿Token

刚刚！捷龙三号遥十运载火箭海上发射圆满成功

行业首个！滴滴，放大招！打车进入“一句话时代”？

高品质音频离不开的芯片！傅里叶半导体通过聆讯，募资加码智能汽车领域|港E声

海上捷龙十问苍穹 | 一图纵览“捷龙三号”运载火箭的太空征途

高品质音频离不开的芯片！傅里叶半导体通过聆讯，募资加码智能汽车领域|港E声

我国成功发射微厘空间02组卫星

我国成功发射微厘空间02组卫星

星际荣耀双曲线三号可重复使用运载火箭一级辅助动力系统试车成功

扩散语言模型总是均匀发力，华为诺亚教它「抓重点」

马斯克旗下xAI加码企业服务赛道，贴身策略争夺AI商业客户

蔡崇信：AI终极目标是造福社会，阿里唯一的方向就是不断创新

星际荣耀双曲线三号可重复使用运载火箭一级辅助动力系统试车成功

AI双引擎驱动载板黄金周期：ABF迎56%复合增长，BT乘存储复苏东风