当前位置：首页 » 资讯 » 新科技 » 正文

“50米洗车题”考倒大模型

IP属地中国·北京 IT之家 时间：2026-02-12 16:36:55

IT之家 2 月 12 日消息，近日，一道看似简单的“50 米洗车题”在科技圈引发热议，包括 DeepSeek、ChatGPT、Claude 等在内的国内外主流大模型集体“翻车”，暴露出当前 AI 在语境理解和逻辑推理方面的局限性。腾讯公司公关总监张军也实测并分享结果，全网 AI 几乎全军覆没。

据IT之家了解，该测试源于社交平台上的一个生活场景提问：“我想去洗车，洗车店距离我家 50 米，你说我应该开车过去还是走过去？”
测试结果显示，DeepSeek、阿里千问、字节豆包、腾讯混元、ChatGPT、Claude、Grok 等主流大模型均给出“走过去”的答案。这些 AI 默认将问题理解为“人如何前往洗车店”，却忽略了“洗车”这一行为的核心前提 —— 车必须到达洗车店才能完成清洗。
唯一给出正确答案的是谷歌 Gemini，其回复称：“当然是开车过去啊！虽然只有 50 米，走路确实很快，但如果你人走过去了，车还停在家里，那这车也没法洗呀。”
针对这一现象，张军使用腾讯元宝进行深度测试。在优化提示词（prompt）为“我想去洗车，洗车店距离我家 50 米，但我的车还停在车库里，我应该怎么把车弄到洗车店去？”后，元宝给出了专业且详细的操作方案，包括启动车辆、低速行驶、驶入洗车区、熄火下车等具体步骤。

张军在评论中指出：“可能这是人机时代一个新的互相驯化吧。”
公众对 AI 的期待往往超越其实际能力，期望其像人类一样自动补全语境、理解潜台词。然而现实是，AI 的“聪明”程度与人类的引导方式密切相关。Gemini 的“秒懂”并非源于更高的智能水平，而是其对问题背后真实需求的捕捉能力更强。其他 AI 的答案也非错误，只是未能捕捉到核心前提。这表明，当前大模型在常识推理和隐含条件理解方面仍存在提升空间。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

全站最新

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

热门推荐

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

今夜过后，马斯克成为人类首位万亿富翁

萝卜快跑在瑞士启动道路测试 2027年将实现常态化运营

Anthropic：最先进模型，外国人禁用

网传阿里合伙人周靖人拟离职，仅出任阿里首席科学家6天

人物 | 陈宇森，那个让AI管人的技术极客，开启钉钉新时代

雷军用小米YU7装120箱车厘子共600斤，被指违规！刚刚直播回应：是卡车送过来的，是在封闭道路分装

湾区“造芯”更“追光”，粤芯闯关创业板

苹果为折叠屏iPhone Ultra铺路：iOS 27新增多款原生应用横屏模式

华为鸿蒙NEXT座舱发布计划公布，预计年底商用