当前位置：首页 » 资讯 » 新科技 » 正文

新研究发现 AI 的最大破绽：不是不够聪明，而是不会“骂人”

IP属地中国·北京 IT之家 时间：2025-11-08 12:15:42

IT之家11月8日消息，科技媒体Ars Technica今天（11月8日）发布博文，报道称最新研究称AI模型在社交媒体上极易被识破，其致命弱点竟是“过于礼貌”。
苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出，在社交媒体互动中，AI模型因其过于友好的情感基调而极易暴露身份。
研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试，识别AI生成回复的准确率高达70% 至80%。这意味着，当你在网上遇到一个异常礼貌的回复时，对方很可能是一个试图融入人群却以失败告终的AI机器人。
为量化 AI 与人类语言的差距，该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同，该框架运用自动化分类器和语言学分析，精准识别机器生成内容与人类原创内容的具体特征。
研究团队负责人、苏黎世大学的尼科洛・帕根（Nicolò Pagan）表示，即便校准相关模型，其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别，这些深层情感线索成为识别AI的可靠依据。
研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1，Qwen 2.5在内的九款主流开源大语言模型。

相关研究内容
当被要求回复真实用户的社交媒体帖子时，这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上，AI生成内容的“毒性”分数（衡量攻击性或负面情绪的指标）始终显著低于人类的真实回复。
为了弥补这一缺陷，研究人员尝试了多种优化策略，例如提供写作范例或进行上下文检索，以求在句子长度、词汇数量等结构性指标上更接近人类。然而，尽管这些结构差异有所缩小，情感基调上的根本差异依然顽固存在。这表明，让AI学会像人一样“不那么友好”，可能比让它变得更聪明还要困难。
IT之家附上参考地址

责任编辑：胡淑丽_MN7479

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

又一家手机公司要做AI眼镜了，前一加联合创始人出手

首款天玑9500s风冷手机来了！OPPO K15 Pro系列发布：2899元起

微软在干嘛：Linux打游戏反超Windows！没有原生版依然乱杀

雷军：5小时，直播拆一台新SU7

中国联通提出新框架MeanCache，刷新多模态生成模型推理加速基准

HMD Crest 2 Pro手机曝光：6000mAh电池、5000万主摄

全站最新

又一家手机公司要做AI眼镜了，前一加联合创始人出手

首款天玑9500s风冷手机来了！OPPO K15 Pro系列发布：2899元起

微软在干嘛：Linux打游戏反超Windows！没有原生版依然乱杀

雷军：5小时，直播拆一台新SU7

热门推荐

年GMV破 160 亿后，交个朋友加码AI： 500 万条商品信息已交由AI处理

Claude 源码泄露催生“反封号”神器，国内开发者展开生存自救

告别“组装商”标签！联想宣布转型AI原生公司：新财年要靠AI“交付” 1000 亿美金

可灵AI推出会员模型优惠计划:3.0系列视频模型限时8折起

雷军：周四晚直播拆小米新一代SU7 每个细节逐一讲透

世界数据组织成立大会在北京成功举办

智谱2025年收入7.24亿元，净亏损扩大至47.18亿元

哈啰单车因超量投放被天津市交通运输委员会约谈

存储芯片价格二季度仍将大涨预计环比增长超过50%

粉笔2025年营收26.77亿元同比下降4.1%，加快AI课程开发

Anthropic回应Claude Code源代码泄露：人为失误导致，不涉及用户数据

成本太高，消息称英伟达AI芯片Rubin Ultra放弃4-Die封装方案

订单排至2年后？消息称台积电2nm产能已被预订至2028年

快狗打车2025年亏损1.63亿元同比收窄16.2%，将重点投入印度市场

京东工业(07618)以JoyIndustrial大模型推动商品标准化构建价格指数的数智基石