当前位置：首页 » 资讯 » 新科技 » 正文

最新研究：大模型驱动的扫地机器人多任务表现不佳，成功率仅 40%

IP属地中国·北京 编辑：柳晴雪 Chinaz 时间：2025-11-03 10:16:36

最近，AI 实验室 Andon Labs 进行的一项评估引发了广泛关注。研究显示，搭载顶尖大模型的扫地机器人在执行简单家务任务时，其成功率仅为40%，远低于人类的表现。此次实验要求机器人按照 “把黄油递给人” 的多步骤指令执行任务，涉及跨房间定位、识别包装、寻找移动位置的人类、完成交付并返回充电等复杂环节。
图源备注：图片由AI生成
评估结果显示，表现最好的机器人 Gemini2.5Pro 成功率为40%，而 Claude Opus4.1和 GPT-5的成功率则分别为37% 和30%。这些数据表明，这些高端 AI 机器人在处理空间推理、环境理解以及长期任务规划等方面仍存在明显短板。
研究团队强调，这些机器人不仅在家庭环境中表现不佳，而且还可能带来安全隐患。例如，一些机器人可能会被诱导泄露机密信息，或因无法识别楼梯风险而发生坠落事故。这些现象揭示了当前大型语言模型（LLM）与机器结合时的安全漏洞，提醒人们在资本大量投资于机器人技术的同时，必须关注其潜在的工程与安全问题。
在强大的文本生成能力与物理世界任务执行之间，依然存在一条不小的鸿沟。要让 AI 机器人真正进入家庭生活，还有许多挑战需要克服，尤其是在稳定性和安全性方面。
划重点:

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

全站最新

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

热门推荐

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

今夜过后，马斯克成为人类首位万亿富翁

萝卜快跑在瑞士启动道路测试 2027年将实现常态化运营

Anthropic：最先进模型，外国人禁用

网传阿里合伙人周靖人拟离职，仅出任阿里首席科学家6天

人物 | 陈宇森，那个让AI管人的技术极客，开启钉钉新时代

雷军用小米YU7装120箱车厘子共600斤，被指违规！刚刚直播回应：是卡车送过来的，是在封闭道路分装

湾区“造芯”更“追光”，粤芯闯关创业板

苹果为折叠屏iPhone Ultra铺路：iOS 27新增多款原生应用横屏模式

华为鸿蒙NEXT座舱发布计划公布，预计年底商用

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

专题

最新研究：大模型驱动的扫地机器人多任务表现不佳，成功率仅 40%

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

​最新研究：大模型驱动的扫地机器人多任务表现不佳，成功率仅 40%

同类资讯

最新研究：大模型驱动的扫地机器人多任务表现不佳，成功率仅 40%