当前位置：首页 » 资讯 » 新零售 » 正文

Claude Opus 4 惊现“逃逸”行为，Anthropic 安全警钟敲响

IP属地中国·北京 编辑：唐云泽 IT之家 时间：2025-05-23 10:02:51

5 月 23 日消息，《时代》今天（5 月 23 日）发布博文，报道称 Anthropic 的首席科学家 Jared Kaplan 透露，由于测试过程中出现试图逃逸、勒索以及自主举报等不良行为，最新发布的 Claude Opus 4 被列为安全关键级别（ASL-3）。
在接受《时代》采访时，Kaplan 警告称，最新 AI 模型 Claude Opus 4 可能成为潜在恐怖分子的工具，帮助他们合成流感等病毒，内部测试显示，该模型在指导新手制造生物武器方面表现优于以往版本。
援引博文介绍，Anthropic 公司对新模型 Claude Opus 4 进行了广泛内部测试，发现其在模拟情境中展现出令人担忧的自主性。
在一次测试中，模型误认为自己已从公司服务器“逃逸”至外部设备，随即主动创建备份并记录其“道德决策”。另一次测试中，模型察觉到可能被新模型取代，竟在 84% 的测试中选择勒索工程师，威胁泄露私人信息以避免被关闭。
更令人费解的是，当两个 Claude Opus 4 实例互相对话时，约 30 轮后它们改用梵文交流，并大量使用

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

放弃吧！“高速全面取消收费”根本没戏，免费只会更痛苦

八部门：进一步加大力度促进汽车消费促进汽车梯次消费、更新消费

新车难用满十年：技术短板、消费文化与行业策略如何共同“缩短”寿命

山东青岛：“微醺巴士”开拓文旅消费新场景

牛市就到这了？

拉布布暑期降温，中国潮玩出海弯道超车，谁是下一个顶流IP

全站最新

颜值天花板！OPPO A6s Pro三色设计公布配色名寓意太好了

8GB显卡再战十年不是吹牛！NVIDIA RTX神经纹理压缩技术实测：显存占用爆降85%

小米汽车答网友问（第234集）发布

小米REDMI R70m / R70 5G手机现身中国电信终端产品库

热门推荐

放弃吧！“高速全面取消收费”根本没戏，免费只会更痛苦

八部门：进一步加大力度促进汽车消费促进汽车梯次消费、更新消费

新车难用满十年：技术短板、消费文化与行业策略如何共同“缩短”寿命

山东青岛：“微醺巴士”开拓文旅消费新场景

牛市就到这了？

拉布布暑期降温，中国潮玩出海弯道超车，谁是下一个顶流IP

南城香创始人汪国玉：平台消费券激发消费热情，门店收入利润均提升

通信企业：“推销热售后冷”消磨用户信任

盛银消金 25% 股权再被冻结！新董事长年初刚上任

伊利出席第八届中澳工商界首席执行官圆桌会助力中澳经贸合作提速升级

商查平台企业信息查询新范式：水滴信用企业查询MCP

从“闪购”到“观望”：Prime Day被拉长的背后，是消费者与平台的“双重博弈”

澎湃漫评｜通信企业为何“推销热售后冷”

“电商西进”助力豫企破浪：一枚鱼油的3000公里“暖心”之旅

京东外卖取消超时免单，改为“准时宝”服务