当前位置：首页 » 资讯 » 新科技 » 正文

Anthropic深夜掀桌！5个月前顶配模型，现在价格只要1/3，速度还翻倍

IP属地中国·北京 新智元 时间：2025-10-16 14:15:03

新智元报道
编辑：KingHZ 好困
Anthropic用Haiku 4.5打响了AI性价比之战！曾经的顶配性能，如今以三分之一的价格、两倍的速度下放，可以说是对高价AI模型的一次降维打击。
AI竞赛风云再起！
刚刚，Anthropic突然出手——发布了全新升级的小模型Claude Haiku 4.5。
它以更强的智能、更快的速度、三分之一的成本，直接打起了AI价格战!
在核心编码测试中，Haiku 4.5已能与GPT-5和Sonnet 4平起平坐，部分任务甚至实现反超。

· Haiku 4.5：输入1美元/百万token，输出5美元/百万token；
· Sonnet 4：输入3美元/百万token，输出15美元/百万token；
· GPT-5/Codex：输入1.25美元/百万token，输出10美元/百万token。
在SWE-bench Verified测试中，Haiku 4.5虽以1.2%的差距落后GPT-5，但输出价格只有后者的1/2，输入为4/5。
当AI性能趋于饱和、成本断崖下跌，「谁能用最低代价释放最大智能」，正成为2025年AI产业的新分水岭。
Haiku 4.5不是Claude系列最强的模型，但它代表了AI经济学的新方向——
高智能不再昂贵，速度与效率才是下一个王座。
Haiku 4.5更强更便宜
5个月前，Claude Sonnet 4还是顶尖技术的代表。如今，Haiku 4.5以三分之一的成本和两倍以上的速度，实现了与其同等的编程性能。
Haiku 4.5在计算机操作任务上已超越Sonnet 4，让Chrome版Claude的运行速度更快。
在Claude Code中，它使多智能体项目和快速原型开发的响应速度显著提升。
2025年是智能体元年，Haiku 4.5是Anthropic的最新一招。
在多项智能体相关测试中，Haiku 4.5比Sonnet 4更强。
具体来说，在软件工程基准测试SWE-bench Verified中，Haiku 4.5获得73.3%的分数——
略高于Sonnet 4的72.7%，GPT-5(high)的72.8%并接近GPT-5 Codex的74.5%。
在Terminal-Bench编码基准测试中，Haiku 4.5得分为41.0%，在Claude系列模型中仅次于Sonnet 4.5的 50.0%。
换句话说，基于Haiku 4.5的AI智能体比基于Sonnet 4的AI智能体，更容易使用命令行工具完成复杂软件任务。
在计算机操作任务基准测试OSWorld中， Haiku 4.5取得了50.7%的成绩，而Sonnet 4为42.2%。
这种能力使AI能够直接与计算机界面交互——点击按钮、填写表单、浏览应用——这有望彻底改变常规数字化任务的自动化方式。

但在推理能力上，Haiku 4.5在多项测试中稍逊Sonnet 4一筹，如研究生级别推理基准测试GPQA Diamond、多语言问答MMMLU、视觉推理测试MMMU等测试上。
唯一的惊喜是，在高中数学竞赛AIME 2025上，Haiku 4.5即便不使用工具，准确率仍比Sonnet 4高10%以上！
在Claude文档中，Anthropic称Haiku 4.5和Sonnet 4.5各有所长，针对的是不同的用户场景：
Claude Sonnet 4.5：针对复杂智能体与编程任务的最优模型，在多数任务中具备最高智能水平
Claude Haiku 4.5：速度最快、智能最高的Haiku模型，性能接近顶级水平。首款支持扩展思考能力的Haiku模型

也就是说，Claude Sonnet 4.5依然是Anthropic的旗舰型号，也是目前全球最强的编码模型。
相比之下，Haiku 4.5为用户提供了新选择：当需要接近顶级的性能，但对成本和效率有更高要求时，Haiku 4.5便是最佳答案。
Claude Haiku 4.5还是Anthropic旗下首款支持扩展思考模式的Haiku模型，便宜模型也有高级推理能力：
高速推理：可访问Claude内部推理过程，助力复杂问题解决
思考总结：提供适用于生产环境的思考输出摘要
交错思考：在工具调用间进行思考，支持更复杂的多步骤工作流
预算控制：通过配置思考令牌预算，平衡推理深度与响应速度
Claude Haiku 4.5具备原生上下文感知能力、现代Claude模型应有的强大编程能力。
Haiku 4.5为标准用户提供20万token的上下文窗口，而访问Claude开发者平台的开发者则可使用100万token 的上下文窗口。
这一扩展容量意味着：在单次请求中，模型可处理极其庞大的代码库或文档——大约相当于一本1500页的书。
这种「高智能+高速度」的结合，或将彻底颠覆那些需要实时、低延迟响应的应用场景——如聊天助手、在线客服、结对编程等。
对于开发者而言，无论是构建复杂的多智能体项目，还是进行快速的产品原型设计，Haiku 4.5都意味着更快的速度，让开发体验变得前所未有的流畅。
更重要的是，这开启了大小模型协同工作的新范式。
例如，开发者可以先用旗舰级的Sonnet 4.5将一个复杂问题拆解为多步计划，然后调度一个由多个Haiku 4.5组成的「工作小队」，并行完成各个子任务。

这种「一个大脑，多双快手」的模式，将极大提升AI系统解决复杂问题的效率和能力。
业内许多人称，AI正进入的关键转折点。

左右滑动查看
进步的代价
对于正在评估AI战略的企业而言，Haiku 4.5既是机遇，也是挑战。
机遇在于：大幅降低的成本，让过去部分无法承受的规模化部署成为可能。
问题在于，AI技术格局的演进速度，已经超出了大多数组织的吸收能力。
正如Anthropic首席产品官Mike Krieger近期在播客中所言，企业正摆脱「AI错失恐惧症」，转而要求具体的指标和可证明的价值。

但建立这些指标和评估框架需要时间——而随着竞争对手的飞速发展，时间可能所剩无几。
从单模型部署到多智能体架构的转变，也要求以新的方式思考AI系统。
企业必须学会编排多个专业化的智能体，每个都为特定任务进行优化，而不再将AI视为一个单一的助手——
这更像是管理一个团队，而非操作一个工具。
AI的基本经济学正在以惊人的速度转变——
今日看来非凡的AI能力，在一年内可能就会变得司空见惯且价格低廉。

Epoch AI：大语言模型的推理价格，正断崖式下跌，但并非均匀分布在所有领域
Anthropic坚持以安全为先的差异化路线，但如何将技术成就转化为可持续的业务增长？
企业是否会选择Claude，而非OpenAI、谷歌以及越来越多竞争对手所提供的日益强大的替代品，这仍是一个悬而未决的问题。
但Anthropic正下一个明确的赌注：未来，单一的最强大模型难题称霸AI行业，而合适的速度、合适的价格、合适的智能才是未来存活的关键。
AI行业的承诺往往超越现实，但Anthropic正以超预期速度兑现：低成本、高性能即是胜利的关键。五个月内价格降至三分之一、性能稳定，这一愿景已成现实。
随着价格在短短五个月内下降三分之二而性能保持稳定，这一承诺正开始变为现实。
参考资料：
https://venturebeat.com/ai/anthropic-is-giving-away-its-powerful-claude-haiku-4-5-ai-for-free-to-take
https://www.anthropic.com/news/claude-haiku-4-5

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

我国新发现一大型金矿！

天猫双11发布会在沪启动，天猫总裁家洛：直播间平均流量涨了40%！

2025元宇宙大会现场：高通孟樸详解AI+XR如何破解元宇宙发展新机遇

三星将重返苹果相机供应链，赴美新建产线供应iPhone 18系列

苹果AI核心高管Ke Yang离职转投Meta，Siri升级与AI业务面临挑战

阿里发布Qoder CLI，可在终端一键实现AI编程

全站最新

我国新发现一大型金矿！

天猫双11发布会在沪启动，天猫总裁家洛：直播间平均流量涨了40%！

2025元宇宙大会现场：高通孟樸详解AI+XR如何破解元宇宙发展新机遇

三星将重返苹果相机供应链，赴美新建产线供应iPhone 18系列

热门推荐

苹果发布M5芯片MacBook Pro：首款AI优化Mac处理器，续航达24小时

香港金管局公布AI沙盒名单，蚂蚁数科成核心技术合作伙伴

通义千问宣布正式推出 Qwen Chat Memory 功能

特斯拉 Optimus 机器人版童装上线，象征AI走进生活

华为nova 14活力版、nova Flip S官宣明天发布

我国新发现一大型金矿！

OPPO快速跟进eSIM 今晚发布的新机就有eSIM版

苗圩：在保障安全的前提下，科学有序推进AI在汽车产业落地

东莞第一“千亿镇”！你的OPPO、vivo手机从这里诞生

天猫双11发布会在沪启动，天猫总裁家洛：直播间平均流量涨了40%！

2025元宇宙大会现场：高通孟樸详解AI+XR如何破解元宇宙发展新机遇

三星将重返苹果相机供应链，赴美新建产线供应iPhone 18系列

苹果AI核心高管Ke Yang离职转投Meta，Siri升级与AI业务面临挑战

谁导演了“1011”加密货币大崩盘？ | 巴伦精选

世界顶尖科学家论坛下周在沪举行，汇聚25位“顶科天团”，12位首次亮相