闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
在对手最擅长的地方打败对手,智谱做到了。
开源模型GLM-4.5在伯克利工具使用榜单上超越Claude Opus 4.1,运行相同任务成本仅为1.4%。
抢在GPT-5之前发布的融合大模型GLM-4.5,以其在前端开发跨文件修改全栈项目构建等场景中的卓越表现受到不少关注。
现在,GLM-4.5的编程能力也已经接近Claude 4。
性能更高、速度更快、价格更低
GLM-4.5采用MoE架构,为评估Agentic Coding能力,团队构建了CC-Bench评测体系。
通过在覆盖六大开发领域、52个实际编程任务中对比GLM-4.5与Claude Sonnet 4、DeepSeek-V3.1、Kimi-K2和 Qwen3-Coder-480B,可以看出GLM-4.5在与顶尖开源模型对比时表现强劲,尤其在任务完成效果和工具调用可靠性方面。
在与Claude Sonnet 4的直接竞争中可以发现,GLM-4.5在编码性能方面接近行业标杆Claude Sonnet 4。
并且,艾伦人工智能研究所研究科学家Tim Dettmers体验后表示:开源的GLM-4.5在推理速度上和闭源模型一样好,甚至比Opus 4.1快3倍、比GPT-5快5倍。
甚至有反馈称,在涵盖多语言、多种函数调用测试的大模型能力权威榜单伯克利工具调用排行榜中,GLM-4.5已经超越Claude 4、Grok-4等。
再细看榜单还可以发现,GLM-4.5花费的成本还是最低的。
说到花费,值得提一嘴的是,智谱还推出了高性价比的Claude Code套餐,价格仅为Claude的1/7,适用于GLM-4.5以及GLM-4.5-Air。
Claude Code是Anthropic推出的开源工具,简单来说就是Claude Code CLI与各类AI模型供应商之间的智能中介,将不同模型接入Claude Code后,就可以根据任务需求选用不同成本的模型。
不止Claude Code,团队称未来还将拓展到更多Coding工具。
目前,GLM-4.5已接入包括Claude Code、Cline、Gemini CLI、Grok CLI、CodeGeeX、Kilo Code、Roo Code、Trae在内的多款主流编程工具,全面支持日常开发流程。
所以,被Claude价格门槛劝退的你,会不会尝试一下GLM-4.5呢?
[1]https://x.com/alxfazio/status/1962399641376354724
[2]https://x.com/Zai_org/status/1962522757536887205
[3]https://x.com/KhaledAlwaleed/status/1962545997373919740
— 完 —