当前位置: 首页 » 资讯 » 新科技 » 正文

Token吞金兽发力,BAT做出了“违背祖训”的决定

IP属地 中国·北京 编辑:吴俊 观察者网 时间:2026-03-20 23:10:38

3月18日,阿里云和百度智能云同日宣布AI算力和存储产品涨价,涨幅最高达34%。一周前,腾讯云刚刚将混元大模型Token价格上调超450%。

中国四大云厂商中的三家,不到十天内集体涨价。而涨价,曾经是云计算行业字典里不存在的词汇。

作为行业领军者,亚马逊AWS用二十年间近百次的降价奠定了整个产业只降不涨的历史基调。贝佐斯那句降价是我们的核心策略,让微软Azure与谷歌云不得不长期祭出激进的降价打法被动迎战。

传导至国内,价格战演绎得更为惨烈。从早年震惊业界的一分钱中标,一年18轮降价的疯狂,再到动辄腰斩乃至降价90%的基操,直至近期大模型战场上从以分计价迅速跌至免费的新一轮厮杀,降价早已融入了云厂商的血液。

降价的底层逻辑是一个自我强化的飞轮:摩尔定律驱动成本下降→降价获取更大市场份额→规模效应摊薄成本→更有底气降价→规模更大。二十年来,这个飞轮越转越快,没有人敢踩刹车。

直到2026年初,亚马逊做出了一个违背祖训的决定,对AI算力容量块实施约15%的价格上调。五天后,谷歌宣布全球大幅上调数据传输及AI基础设施服务价格;随后欧洲头部云服务商Hetzner、OVHcloud相继跟进;国内网宿科技、优刻得、智谱也在2月先后宣布涨价,一个季度内API价格近翻倍。

阿里云在18日的公告中明确指出了转向的原因:因全球AI需求爆发、供应链涨价,其平头哥真武810E等算力卡产品上涨5%~34%,文件存储产品CPFS(智算版)上涨30%。百度智能云不仅给出了几乎一致的涨幅(AI算力上调约5%~30%,并行文件存储上调约30%),甚至连新价格的生效日期都与阿里默契地选在了同一天——4月18日。

而先行一步的腾讯云,动作更为彻底。除了将混元HY2.0 Instruct的输入价格从每千Token 0.0008元暴涨至0.004505元外,其平台上的GLM 5、MiniMax 2.5、Kimi 2.5三个模型也宣告结束限时免费公测,转为正式商用计费。

观察者网获悉,字节火山引擎虽未发布正式涨价公告,但已全面收紧优惠政策、暂停首购特惠活动,通过取消补贴实现变相控价,成为行业集体转向的隐性信号。

从AWS到谷歌,从欧洲到国内,从二线厂商到头部巨头,整个云计算产业链在同一个季度里完成了看似不可思议的集体转向。

为什么是现在?

某家头部云厂商负责人对观察者网表示:供应链是这轮涨价的核心原因。成本涨到这个程度,行业内谁都不可能再亏损换客户了。

最直观的压力来自GPU。截至2月底,英伟达H200、H100等高端GPU租金环比上涨15%~30%。

这背后是核心存储组件对整个算力硬件的成本倒逼。全球95%的HBM产能被三星、SK海力士、美光三家垄断,行业普遍认为这一短缺可能持续至2028年,成为AI行业结构性约束。

这也直接导致2026年Q1传统DRAM合约价格环比暴涨约90%~95%,DDR5内存芯片现货价格半年最高涨近6倍,服务器级合约价单季翻倍。

与此同时,物理基础设施的成本同样在失控。

智算中心单机柜功耗从传统数据中心的5kW飙升至120kW以上,数据中心电力及散热成本占运营总成本的比例已高达40%~60%。

阿里和百度云的公告也印证了这一趋势。阿里云强调全球AI需求爆发、供应链涨价,百度智能云则直接指出核心硬件及相关基础设施成本出现显著上涨。

但单纯的成本压力并不足以支撑全行业的集体提价,真正的驱动力来自需求端的爆发与结构性转变。

2025年上半年中国公有云上大模型调用量达536.7万亿Tokens,较2024年全年增长近400%。到2026年2月,中国日均Token消耗已到180万亿级别。3月9日至15日这一周,中国AI大模型周调用量更是首次超过美国。

更关键的是需求结构的变化:AI应用大规模落地后,推理需求占总算力需求首次突破70%,取代训练成为算力消耗的第一驱动力。训练需求是间歇性的、可预测的;推理需求是持续性的、实时的——算力消耗从可调度的批量任务变成了随时随地的实时负载,对供给侧形成的压力完全不同。

龙虾改变了一切

龙虾(OpenClaw)的爆火则进一步加剧了云计算资源的紧张。

2026年春节期间,OpenClaw这款AI助手项目爆火。猎豹移动CEO傅盛透露,他的龙虾采用最高配置,每天高频调度,一个月花费近3万元。有用户反映重度使用下1亿Token大概只够撑一个月,成本约7000元。一位开发者在社区分享:使用OpenClaw做自动化任务,2个小时就消耗了100美元。

这种Agent级别的算力吞噬力,直接打乱了云厂商的产品节奏。 “龙虾”的爆火引发了外部API调用量的海啸,而云厂商自家的AI原生应用也同样面临着算力挤兑。春节前后,阿里云上线的Coding Plan订阅服务,首购优惠仅推出十天,就因调用量暴涨被迫改为每日限时限量供应。

腾讯云面临着同样的算力水位压力,但动因更为复杂:除了外部Agent应用密集上线带来的推理端消耗骤增,腾讯还在全面推进微信生态的AI化。其自研的WorkBuddy、QClaw等内部智能体对算力有着极高且确定性的需求——在外部亏本赚吆喝和内部保供给之间,涨价本质上就是通过价格杠杆调节资源配置,优先保障自有核心生态。

但这不只是一个爆款带来的短期波动。从全民养龙虾,到影视行业拥抱视频大模型,再到各类AI原生工作平台的发布,Agent时代的Token消耗量是传统问答的数十倍乃至百倍。当刚性需求爆发到了不需要再用低价吸引用户的地步,云厂商终于有了彻底终结这场价格战的筹码。

在供应链的共性压力与需求侧的底气之上,头部厂商还在做一件事:把商业模式从出租算力向出售Token迁移。

过去,云厂商的生意是把GPU按卡时租出去,客户自己部署模型、自己做推理优化,云厂商赚的是硬件差价。现在,头部厂商开始把大模型封装成API,按Token数计费,模型研发、推理优化、调度分配全部由云厂商搞定。

这种迁移将深刻改变云厂商的利润结构与竞争逻辑。

从厂商侧的利润结构来看。卖算力时,硬件成本是透明的,GPU是标准品,你家H200和我家H200没有区别,利润空间几乎固定。但卖Token时,推理优化变成了一个黑箱——同一张GPU卡,如果你的推理引擎比别人快3倍,你就能用同样的硬件成本产出3倍的Token,多出来的部分就是利润。客户只看到每千Token多少钱,看不到你背后的成本结构。

而更关键的在于智能体时代,客户侧的迁移成本将大幅上升。表面上看,Token API的切换成本不高,换一个节点、微调一下prompt,就能从千问切到混元。但这个逻辑只在2024年单轮对话、简单问答的时代成立。在Agentic AI时代,当企业客户将模型深度接入自身业务工作流,涉及到复杂的系统调优、功能适配、JSON格式化输出的稳定性——不同模型处理复杂指令的表现差异极大,一旦业务线基于某个模型跑通了闭环,切换模型的隐性成本极其高昂,现在重度Agent客户的迁移成本不是变低了,而是变得深不可测。这也是云厂商敢于按下提价键的真正底牌。

Token时代的新逻辑

但头部厂商的算盘不止于此。

英伟达CEO黄仁勋在近期GTC大会上提出了Token工厂经济学——未来的数据中心不再是存储文件的仓库,而是生产Token的工厂。

当Token消耗量到了每天180万亿的量级,Token本身就变成了一种基础生产资料——类似电力之于工业时代,石油之于汽车时代。谁控制了Token的生产、分发和定价链路,谁就控制了AI时代的电网。而未来的定价权不仅在芯片手里,更在并网容量和液冷散热的统筹能力里——因为算力基础设施的物理约束,往往比芯片短缺更难突破。

3月16日,阿里成立全新的Alibaba Token Hub(ATH)事业群,由CEO吴泳铭直接负责,整合通义实验室、千问事业部、百炼MaaS业务线,覆盖从基础模型研发到AI应用的完整链路。吴泳铭在内部信中写道:大量数字化工作将由数以百亿计的AI Agent来支撑,而这些AI Agent将由模型产生的Token支撑运行。

阿里的算盘是打通底层的Token水电话费,腾讯的算盘则打在另一处——生态闭环与高毛利SaaS。

腾讯高层曾多次明确表示AI是全业务的乘数。腾讯云率先敢将Token价格上调450%,其真正的底气在于,混元大模型已经深度接入微信、广告、游戏等数百个内部核心业务。当外部的算力亏本买卖做不下去时,收缩价格战战线、优先保障腾讯庞大内部生态的算力供给,并将外部商业模式从低毛利的IaaS(基础设施)向高毛利的MaaS和SaaS转移,成为了极其清晰的战略。目前腾讯云SaaS收入增速持续跑赢IaaS,正是这一逻辑的兑现。

百度则在全力压榨先发优势与软硬协同的利润空间。百度内部已将AI相关收入目标增速从100%大幅上调至200%,其底层支撑正是昆仑芯的大规模部署带来的成本对冲能力。

阿里重兵押注全栈基础设施,腾讯收网聚焦生态与SaaS,百度死磕软硬协同。但大方向完全一致——短期靠提价与推理效率扩大利润空间,长期靠全链路卡位争夺Token时代的基础设施位置。

值得注意的是,从阿里云官网的涨价列表看,平头哥真武810E芯片涨幅34%,是本轮涨幅最高的产品。真武810E已服务国家电网、中国科学院、小鹏汽车、新浪微博等400多家客户——自研芯片不仅是这轮涨价周期里的成本对冲工具,更是通过软硬协同优化提升Token生产效率、放大利润空间的底层底座。2025年谷歌的价值重估,很大程度上得益于自研TPU的广泛使用;今年,自研芯片在AI涨价周期中的战略价值正在凸显,同样的逻辑正在中国的头部云厂商身上展开。

BAT集体做出了违背祖宗的决定不是因为某一家厂商想涨价,而是整个行业被同一股力量推到了一个临界点——供应链成本涨到了没有人再亏得起的地步,AI需求又爆发到了不需要再用低价吸引用户的地步。

云计算的下半场,不再是比谁更便宜,而是比谁更智能。

火山引擎会不会跟进?

但这场转向中最大的悬念,或许不是已经涨价的三家,而是还没有涨价的那一家——字节跳动旗下的火山引擎。

2024年,正是火山引擎打出低于行业均价99.3%的豆包定价,点燃了那一轮惨烈的降价战。但进入2026年,火山引擎自身的战略也在发生剧变:销售考核从GPU算力转向大模型及AI工具,MaaS业务收入目标从2025年的20亿量级直指百亿规模——它自己也在从卖算力转向卖Token。

这就是火山引擎面对的两难:一边是百亿MaaS收入的激进冲量目标,逻辑上需要继续低价抢市场;另一边是三大同行集体涨价、硬件成本飙升,连亏损换客户的空间都被压缩了。更何况,2025年火山引擎Token消耗总量超过9000万亿,但绝大多数Token都是免费送出的,真正产生扣费的付费流量比例极低。

更深的差异在于底牌厚度。阿里有平头哥真武、百度有昆仑芯,自研算力芯片已形成规模商业化部署,在这轮硬件成本上涨周期中拥有真实的成本对冲能力。火山引擎虽有DPU和算力芯片方向的研发投入,但尚无可规模部署的自研AI算力芯片——面临的可能不只是要不要继续做价格屠夫的战略选择,而是在硬件成本重压、算力受制于人的处境下,被迫跟随整个行业的节奏。下半场的牌桌上,没有自己印钞机的玩家,连打价格战的资格都会被逐渐剥夺。

当整个行业的Token定价开始回归合理水平,火山引擎是继续用亏损冲规模,还是顺势跟涨、把庞大的调用量转化为真实收入?这个选择的答案,将比三家涨价本身更能说明问题——它将决定这轮涨价到底是一次短期的成本传导,还是整个行业告别免费午餐的真正起点。

标签: 成本 模型 厂商 算力 涨价 行业 价格 火山 硬件 引擎 利润 腾讯 时代 头部 芯片 基础设施 逻辑 规模 百度 客户 集体 降价 核心 空间 产品 智能 压力 部署 消耗 真武 价格战 供应链

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。