当前位置: 首页 » 资讯 » 新科技 » 正文

Claude 4.1 发布:更强的Agent、代码和推理

IP属地 中国·北京 编辑:孙雅 赛博禅心 时间:2025-08-06 06:06:36

今天凌晨,Claude Opus 4.1 模型发布

Pro/Max/Team 用户可在网页端使用,API 已开放

Claude.ai 已可使用性能更强,价格不变

能力全面提升

按 Anthropic 的官方说法,Claude Opus 4.1 是 Opus 4 的直接替代品 ,在编程、写作、工具调用以及Agent 方面,都得到了全面提升

Agent 能力:能准确处理长时程任务,以及复杂企业工作流程,在TAU-bench表现优异;

高级编程:能完成上千步骤的长程编程任务,支持单次 32k 下文输出;

更强的搜索:能独立进行数小时研究任务,更为有效的进行内外信息搜索;

更强的写作:写的更像人

根据公开基准测试数据,Claude Opus4.1 在各个榜单上,都完成了对老版本的超越,详细如下图。

编程相关跑分

这里专门说一下 SWE-bench 榜单,这是一个编程榜单。

榜单中,Opus 4.1 得分为 74.5% 为最高,紧随其后的是 Claude Sonnet 4,下图是更为具体的数据

SWE-bench

附录

附1:Claude Opus 4.1 信息卡/技术报告

https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf附2:相关链接

Claude Webapp

www.claude.ai

Claude Opus 官方信息

https://www.anthropic.com/claude/opus

标签: 编程 agent 榜单 代码 swe-bench 基准 claude

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。