当前位置：首页 » 资讯 » 新科技 » 正文

探索AI写代码极致：Claude Opus 4.1模型登场，软件工程能力再攀新高峰

IP属地中国·北京 编辑：陆辰风 TechWeb 时间：2025-08-06 10:20:00

8 月 6 日消息，Anthropic 公司今天（8 月 6 日）发布公告，宣布推出 Claude Opus 4.1 模型，相比较今年 5 月推出的 Claude 4 系列模型，主要改进了编码、推理和执行指令的能力。
Anthropic 表示，Claude Opus 4.1 在 SWE-bench Verified 上（用于评估软件工程准确性）提升到了 74.5%，作为对比，Claude Sonnet 3.7 的准确率为 62.3%，而 Claude Opus 4 的准确率为 72.5%。具体来说，更新后的模型在“深度研究和数据分析技能，尤其是在细节追踪和代理搜索方面”表现得更加出色。
与 Opus 4 相比，Opus 4.1 在大多数功能上都有所提升，特别是在多文件代码重构方面表现尤为突出。附上相关数据如下：
Rakuten Group 发现，Opus 4.1 不做不必要的调整或引入新的错误，能够精确地在大型代码库中定位并修正错误。
Windsurf 报告称，Opus 4.1 在其初级开发者基准测试中，比 Opus 4 表现提高了标准差的一个单位，这一性能飞跃与从 Sonnet 3.7 到 Sonnet 4 的跳跃相当。
最新的模型今日起面向 Claude 客户开放，可以通过 Claude Code、Anthropic 的 API、亚马逊 Bedrock 和谷歌云的 Vertex AI 使用。
同时，Anthropic 在社交媒体上表示，计划在未来几周内发布“对我们模型的重大改进”，因此可以期待 Claude 系列模型的更多升级。OpenAI 也预计将在本周发布新消息。（故渊）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

索尼独供时代宣告终结：三星正式杀入iPhone 18果链

黄仁勋称OpenClaw“绝对是下一个ChatGPT”

宝马7系中期改款和下一代X5照片曝光

三星确认旗下首款三折叠手机Galaxy Z TriFold将从韩国市场下架

告别20多年经典小熊猫，火狐Firefox浏览器将启用Kit吉祥物

美高管急：看看这，一年前还啥啥不会呢

全站最新

索尼独供时代宣告终结：三星正式杀入iPhone 18果链

黄仁勋称OpenClaw“绝对是下一个ChatGPT”

宝马7系中期改款和下一代X5照片曝光

三星确认旗下首款三折叠手机Galaxy Z TriFold将从韩国市场下架

热门推荐

西贝要赔给员工的钱，有着落了

别再被OpenClaw“养虾”给忽悠了

港交所上市机制再革新，如何平衡“新欢”与“旧爱”？

《K-POP：猎魔女团》拿下奥斯卡，Netflix击败迪士尼！好莱坞的顶级内容战

阿里发起“Token总动员”

腾讯的最后一根稻草

一节百元Python课，让我背上数十倍分期债

面对手机涨价潮，换机党该“买”还是该“等”？

古井贡酒太强，迎驾和口子窖再也追不上

理想「失速」：增程红利见顶，AI难解近渴

从“年年曝光”到“人人反诈”，年轻人正在改写「维权剧本」

美宜佳该刮骨疗伤了

「AI厂长」黄仁勋

波斯湾的战云，船坞里的周期

拆解重庆啤酒：增长还在，难处已变