当前位置：首页 » 资讯 » 新科技 » 正文

智谱守精品，MiniMax攻规模：大模型没有乔布斯

IP属地中国·北京 编辑：孙明新立场 时间：2026-04-11 11:57:23

模型越强，离红利越远？
新立场
4月8日，智谱进行了今年第三次涨价。
在2月代码订阅套餐价格上调30%，3月旗舰API价格上调20%后。昨日，模型聚合平台OpenRouter数据显示，GLM系列API价格再度上调10%，配合同日发布的旗舰开源模型GLM-5.1，调价后其编程场景缓存命中Token单价，已接近Anthropic旗下Claude Sonnet 4.6的水平。截至收盘，智谱股价涨幅11.49%，报868港元，市值3872亿港元。
与此同时，API年化收入（ARR）在过去12个月内暴涨60倍至17亿元人民币，Token调用量在价格累计上调83%的背景下逆势增长400%。CEO张鹏对外的表述只有一句话：瓶颈在算力，不在客户。
在整个中国大模型行业仍以价格战换市场的语境下，这一反向操作的底层逻辑，被智谱以罕见的坦率写入了首份财报，并压缩成一个方程式：AGI商业价值 = 智能上限 × Token消耗规模。
对智谱而言，它是一套完整的战略操作系统，规定了研发投入的优先级、定价策略的方向，以及公司在市场份额与利润率之间如何取舍。全球范围内，OpenAI在安全报告里讲叙事，Anthropic以负责任扩展塑造品牌，谷歌把AI经济学深埋在集团财报之中。从这个意义上说，智谱是全球极少数敢于将自身全部商业逻辑公开量化的AI公司。
智能上限，是智谱认为自己能够掌控的变量。4月8日发布的GLM-5.1在最接近真实软件开发场景的SWE-bench Pro基准上首次超越Claude Opus 4.6。更引人注目的是其长程任务能力：GLM-5.1能在单次任务中持续自主工作长达8小时，自主规划、执行、测试，碰壁时切换策略，出错后自行修复，最终交付工程级成果。
Token消耗规模，是智谱认为将随智能上限提升而放大的因变量。以OpenClaw为代表的Agentic工具链在2026年初的爆发，验证了这一逻辑的短期弹性，单次复杂任务涉及数百次工具调用和数千轮内部推理，Token消耗量是普通对话的数十至数百倍，总调用量由此呈指数而非线性增长。
在纸面上，这套逻辑完美自洽。但商业世界里，方程式的优雅从未等同于胜算。智谱需要回答的命题是：在一个转换成本趋近于零的API市场里，仅凭模型的能力代差，究竟能不能建立起真正的定价权？尤其是当技术的领先窗口不可避免地被压缩时，这家公司又将如何支撑它庞大的成长预期？
大模型没有死忠粉
理解智谱定价权主张的正确起点，不是看它的模型有多强，而是先理解它所身处的市场，从结构上就不支持传统意义的定价权。
Oracle在数据库领域维持数十年高溢价，依赖的是数百万行业务逻辑深度嵌入客户系统后产生的迁移恐惧，以及切换供应商意味着多年工程周期和数亿美元整合风险。这类定价权的本质，是随使用年限递增、几乎不可逆的转换成本积累。
API经济从结构上摧毁了这道护城河。更换一个大模型API供应商，技术层面通常只需修改接口端点、调整若干参数，工程师可以在一个下午完成迁移测试和验证。这意味着，在大模型API市场，理论上有且只有一种持久的定价权来源，即模型能力代差本身。这是智谱方程式的底层假设，也是它在逻辑上最暴露的地方。
以中国开源生态的迭代密度，压缩速度只会更快。DeepSeek、Qwen的迭代节奏，以及今天的GLM-5.1本身，都是这一趋势的组成部分。这意味着，任何单一厂商基于基准测试领先所建立的定价权，其有效窗口期可能以季度而非年度来计量。
而企业客户在购买API服务时，优先级序列是什么？从智谱目前的收入结构可以得到一个反直觉的答案。2025全年，智谱本地化部署（即企业私有化部署）收入达5.34亿元，占总营收73.7%，仍是绝对的收入主力。
大量客户黏性建立在私有化部署产生的集成成本和运维依赖之上，而非纯粹的API能力代差逻辑。尤其是其本地化部署业务长期积累的政企客户关系，而这恰恰是传统意义上的转换成本逻辑，而非公式中所假设的智能上限逻辑。
事实上，智谱的这场冒险存在着一个坚实的支点：任务复杂度的跃升，可能从根本上改变API市场的定价经济学，从而使能力代差从可替代变为不可替代。
GLM-5.1所代表的长程任务能力，在单次任务中持续自主工作8小时，与此前以分钟级交互为主的聊天模型之间，是质的差异，而非量的差异。在长程任务场景中，模型的上下文一致性、自我纠错能力和局部最优逃逸能力之间的差距，会被时间轴放大，一个在短对话中仅有微小差异的模型，在8小时连续执行中可能产生结果上的断崖分化。
这意味着，随着Agentic应用场景的规模化，足够好与最强之间的功能差距，可能从不可感知变为不可接受，此时，能力代差将首次产生真正意义上的转换成本。
但这一逻辑成立的前提，是Agentic场景必须足够快速、足够深入地成为主流商业化战场，而这也是智谱方程式的核心赌注。
方程式本身并不能证明这个前提成立，它只是在该前提下，提供了一套内部一致的战略推论。
谁赚到了Token最大的流量红利？
方程式的第二项，从来不是某家厂商单独的战场。在这场战争中，智谱的位置，比它的基准测试排名所呈现的，要复杂得多。
2026年初，中国大模型行业的Token调用量出现了一次断层式跃升。OpenRouter数据显示，三月初，中国大模型周调用量达到4.69万亿Token，连续两周超越美国，全球排名前五均为国产模型。驱动这一跃升的，是以OpenClaw为代表的Agentic编程工具链的大规模普及。
根本原因在于，Agent工具链的调用量分布，遵循类似于互联网流量的幂律结构，绝大多数调用来自轻量级、高频的日常自动化请求，工程级的长程任务只占极小比例。这恰好是智谱的弱势场景，高定价在规模竞争中构成结构性阻力，而精品定位的用户群体，其调用量天花板远低于大众化工具的日活规模。
AGI浪潮真正的盛宴，属于那些愿意在价格竞争中让利、以模型调用量换生态覆盖率的厂商。智谱的精品逻辑，意味着它正在系统性地错过这一轮由普适Agent驱动的增量红利。这是市场的自然筛选，也是智谱主动写在方程式里的必然。
写在最后
智谱方程式本身所指向的核心命题，最终仍要回到技术竞争的物理规律。唐杰在AGI前沿峰会上的那句话，值得被完整引用：大模型到现在更多的是在拼速度、拼时间，也许我们代码正确了，也许我们就会在这方面走的更远一点，但也许失败以后就半年，半年就没了。
在大模型赛道，能力迭代的速度已经系统性地快于竞争优势的固化速度。GLM-5.1今日在SWE-bench Pro上的成绩，是一个真实的技术里程碑；六个月后，它将成为历史注脚，而非持续的竞争护城河。这是一条所有参与者都必须正视的规律，与公司的背景和结构都无关。
智谱AI的第一份年度财报，以一个方程式开篇，以一系列开放性问题收尾。一家全年营收仅够覆盖三个月研发支出的公司，能否在技术窗口关闭之前，将能力溢价转化为结构性护城河？能否在算力瓶颈解除之前，将供不应求的稀缺性转化为长期客户粘性？能否在下一轮行业价格战到来之前，完成从最强模型到不可替代系统的跃迁？
它们的答案，将取决于方程式中的哪一项先出现变化：是智能上限的领先窗口在开源竞争中提前关闭，还是Token消耗规模在高阶场景的增量，最终无法覆盖精品定位的规模天花板。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

字节、阿里齐变阵，大厂“集中兵力”开打AI办公下半场

第一到第六，全是中国大模型

Anthropic回应开源争议，文字游戏还是商业霸权？

具身智能走到哪了：缺数据是共识，大模型“根基不稳”

一个模型控制机器人从头到脚所有运动，谷歌发布新一代机器人基础模型

见证创新力量！第二届“数龙杯”各项大奖依次揭晓

全站最新

字节、阿里齐变阵，大厂“集中兵力”开打AI办公下半场

第一到第六，全是中国大模型

Anthropic回应开源争议，文字游戏还是商业霸权？

荣耀官宣韩寒出任“荣耀影像创想家”

热门推荐

青岛芯聚产业投资基金登记成立出资额5.01亿

字节、阿里齐变阵，大厂“集中兵力”开打AI办公下半场

第一到第六，全是中国大模型

Anthropic回应开源争议，文字游戏还是商业霸权？

青岛芯聚产业投资基金登记成立出资额5.01亿

DeepSeek今年已增资65%

中信金石、青岛啤酒等成立文化科技投资基金出资额10亿

演员寇占文已被限消

马斯克辟谣特斯拉考虑出售中国业务：假消息

雷军再发英文回应澎程装载能力：只有澎程能做到

广汽本田公布辅助驾驶系统专利

长鑫科技上市首周股价飙涨5倍

张小龙再退出三家粉笔关联公司

工信部：截至6月末5G基站总数达510.2万个，比上年末净增26.3万个

具身智能走到哪了：缺数据是共识，大模型“根基不稳”