研究员|林方舟
4月8日,智谱发布并开源了该公司迄今最强的智能模型——GLM-5.1。
GLM-5.1最大的亮点之一在于其在长程任务上的突破,能够在单次任务中持续、自主工作长达8小时。在最贴近真实软件开发场景的SWE-bench Pro基准测试中,GLM-5.1刷新了全球最佳成绩,实现了国产模型对Claude Opus 4.6的首次超越。
但同日,智谱CEO张鹏在北京亦庄联合“数字生命卡兹克”举办的AIFUT大会上表示,当前最好的国产大模型,与全球顶级大模型之间,仍然有半年到1年的差距。
“(我们)过去欠的债太多,要填的坑太多,需要尽快加速补上来。”张鹏说。
零一万物CEO李开复也表达了类似的观点,他认为中国顶尖大模型落后美国同行6-9个月。
根据OpenRouter最新数据,2026年3月23日至3月29日,中国AI大模型的周调用量上升至9.857万亿Token,较此前一周上涨33.94%,连续四周超过美国,且差距越拉越大。同期美国AI大模型周调用量为3.007万亿Token,环比增长1.79%。
在前述大会上谈及智能体的应用时,张鹏认为,2026年将成为AI Agent真正意义上的“应用元年”。
这一判断并非基于模型技术的突破,因为技术边界早已跨过,而是模型能力、工程架构与系统工具链协同进化的结果。
张鹏将AI的发展历程定义为三个阶段:第一阶段,即GPT-3阶段,是知识压缩和学习效率,第二阶段,DeepSeek阶段,是更高效、更低资源,第三阶段是推理和自学习。
不同的问题定义,直接决定产品的技术路径。智谱当前的定义是:让模型以多能力平衡的方式发展,解决现实世界中的复杂任务与长期规划问题。
GLM-5.1发布后,智谱GLM再度提价10%,编码场景定价已接近Anthropic旗下Claude Sonnet4.6水平,这在行业普遍以降价策略争夺市场份额的背景下,显得有些特殊。
张鹏还透露了智谱的Lab业务——一个负责创新的实验室,其使命就是让整个公司保持多样性和对未来创新的活力,主打广泛性探索,比如神经网络如何优化,软硬件接口如何打通,让有核心的能力在应用世界里做更多的事情等,“不能说长期,反正中短期的路径和方向是明确的”。
业内有观点认为,智谱GLM-5.1的发布和API调价,一定程度上也在体现中国大模型在国际市场上地位的提升。
编辑|邱慧
疯狂科技厅
点击
点击
点击
点击重
张猛等6个朋友
复制搜一搜
复制搜一搜
暂无评论
试写留言重试14重试10重试15





京公网安备 11011402013531号