当前位置：首页 » 资讯 » 新科技 » 正文

Token吞金兽发力，BAT做出了“违背祖训”的决定

IP属地中国·北京 编辑：吴俊观察者网 时间：2026-03-20 23:10:38

3月18日，阿里云和百度智能云同日宣布AI算力和存储产品涨价，涨幅最高达34%。一周前，腾讯云刚刚将混元大模型Token价格上调超450%。
中国四大云厂商中的三家，不到十天内集体涨价。而涨价，曾经是云计算行业字典里不存在的词汇。
作为行业领军者，亚马逊AWS用二十年间近百次的降价奠定了整个产业只降不涨的历史基调。贝佐斯那句降价是我们的核心策略，让微软Azure与谷歌云不得不长期祭出激进的降价打法被动迎战。
传导至国内，价格战演绎得更为惨烈。从早年震惊业界的一分钱中标，一年18轮降价的疯狂，再到动辄腰斩乃至降价90%的基操，直至近期大模型战场上从以分计价迅速跌至免费的新一轮厮杀，降价早已融入了云厂商的血液。
降价的底层逻辑是一个自我强化的飞轮：摩尔定律驱动成本下降→降价获取更大市场份额→规模效应摊薄成本→更有底气降价→规模更大。二十年来，这个飞轮越转越快，没有人敢踩刹车。
直到2026年初，亚马逊做出了一个违背祖训的决定，对AI算力容量块实施约15%的价格上调。五天后，谷歌宣布全球大幅上调数据传输及AI基础设施服务价格；随后欧洲头部云服务商Hetzner、OVHcloud相继跟进；国内网宿科技、优刻得、智谱也在2月先后宣布涨价，一个季度内API价格近翻倍。
阿里云在18日的公告中明确指出了转向的原因：因全球AI需求爆发、供应链涨价，其平头哥真武810E等算力卡产品上涨5%~34%，文件存储产品CPFS（智算版）上涨30%。百度智能云不仅给出了几乎一致的涨幅（AI算力上调约5%~30%，并行文件存储上调约30%），甚至连新价格的生效日期都与阿里默契地选在了同一天——4月18日。
而先行一步的腾讯云，动作更为彻底。除了将混元HY2.0 Instruct的输入价格从每千Token 0.0008元暴涨至0.004505元外，其平台上的GLM 5、MiniMax 2.5、Kimi 2.5三个模型也宣告结束限时免费公测，转为正式商用计费。
观察者网获悉，字节火山引擎虽未发布正式涨价公告，但已全面收紧优惠政策、暂停首购特惠活动，通过取消补贴实现变相控价，成为行业集体转向的隐性信号。
从AWS到谷歌，从欧洲到国内，从二线厂商到头部巨头，整个云计算产业链在同一个季度里完成了看似不可思议的集体转向。
为什么是现在？
某家头部云厂商负责人对观察者网表示：供应链是这轮涨价的核心原因。成本涨到这个程度，行业内谁都不可能再亏损换客户了。
最直观的压力来自GPU。截至2月底，英伟达H200、H100等高端GPU租金环比上涨15%~30%。
这背后是核心存储组件对整个算力硬件的成本倒逼。全球95%的HBM产能被三星、SK海力士、美光三家垄断，行业普遍认为这一短缺可能持续至2028年，成为AI行业结构性约束。
这也直接导致2026年Q1传统DRAM合约价格环比暴涨约90%~95%，DDR5内存芯片现货价格半年最高涨近6倍，服务器级合约价单季翻倍。
与此同时，物理基础设施的成本同样在失控。
智算中心单机柜功耗从传统数据中心的5kW飙升至120kW以上，数据中心电力及散热成本占运营总成本的比例已高达40%~60%。
阿里和百度云的公告也印证了这一趋势。阿里云强调全球AI需求爆发、供应链涨价，百度智能云则直接指出核心硬件及相关基础设施成本出现显著上涨。
但单纯的成本压力并不足以支撑全行业的集体提价，真正的驱动力来自需求端的爆发与结构性转变。
2025年上半年中国公有云上大模型调用量达536.7万亿Tokens，较2024年全年增长近400%。到2026年2月，中国日均Token消耗已到180万亿级别。3月9日至15日这一周，中国AI大模型周调用量更是首次超过美国。
更关键的是需求结构的变化：AI应用大规模落地后，推理需求占总算力需求首次突破70%，取代训练成为算力消耗的第一驱动力。训练需求是间歇性的、可预测的；推理需求是持续性的、实时的——算力消耗从可调度的批量任务变成了随时随地的实时负载，对供给侧形成的压力完全不同。
龙虾改变了一切
龙虾（OpenClaw）的爆火则进一步加剧了云计算资源的紧张。
2026年春节期间，OpenClaw这款AI助手项目爆火。猎豹移动CEO傅盛透露，他的龙虾采用最高配置，每天高频调度，一个月花费近3万元。有用户反映重度使用下1亿Token大概只够撑一个月，成本约7000元。一位开发者在社区分享：使用OpenClaw做自动化任务，2个小时就消耗了100美元。
这种Agent级别的算力吞噬力，直接打乱了云厂商的产品节奏。 “龙虾”的爆火引发了外部API调用量的海啸，而云厂商自家的AI原生应用也同样面临着算力挤兑。春节前后，阿里云上线的Coding Plan订阅服务，首购优惠仅推出十天，就因调用量暴涨被迫改为每日限时限量供应。
腾讯云面临着同样的算力水位压力，但动因更为复杂：除了外部Agent应用密集上线带来的推理端消耗骤增，腾讯还在全面推进微信生态的AI化。其自研的WorkBuddy、QClaw等内部智能体对算力有着极高且确定性的需求——在外部亏本赚吆喝和内部保供给之间，涨价本质上就是通过价格杠杆调节资源配置，优先保障自有核心生态。
但这不只是一个爆款带来的短期波动。从全民养龙虾，到影视行业拥抱视频大模型，再到各类AI原生工作平台的发布，Agent时代的Token消耗量是传统问答的数十倍乃至百倍。当刚性需求爆发到了不需要再用低价吸引用户的地步，云厂商终于有了彻底终结这场价格战的筹码。
在供应链的共性压力与需求侧的底气之上，头部厂商还在做一件事：把商业模式从出租算力向出售Token迁移。
过去，云厂商的生意是把GPU按卡时租出去，客户自己部署模型、自己做推理优化，云厂商赚的是硬件差价。现在，头部厂商开始把大模型封装成API，按Token数计费，模型研发、推理优化、调度分配全部由云厂商搞定。
这种迁移将深刻改变云厂商的利润结构与竞争逻辑。
从厂商侧的利润结构来看。卖算力时，硬件成本是透明的，GPU是标准品，你家H200和我家H200没有区别，利润空间几乎固定。但卖Token时，推理优化变成了一个黑箱——同一张GPU卡，如果你的推理引擎比别人快3倍，你就能用同样的硬件成本产出3倍的Token，多出来的部分就是利润。客户只看到每千Token多少钱，看不到你背后的成本结构。
而更关键的在于智能体时代，客户侧的迁移成本将大幅上升。表面上看，Token API的切换成本不高，换一个节点、微调一下prompt，就能从千问切到混元。但这个逻辑只在2024年单轮对话、简单问答的时代成立。在Agentic AI时代，当企业客户将模型深度接入自身业务工作流，涉及到复杂的系统调优、功能适配、JSON格式化输出的稳定性——不同模型处理复杂指令的表现差异极大，一旦业务线基于某个模型跑通了闭环，切换模型的隐性成本极其高昂，现在重度Agent客户的迁移成本不是变低了，而是变得深不可测。这也是云厂商敢于按下提价键的真正底牌。
Token时代的新逻辑
但头部厂商的算盘不止于此。
英伟达CEO黄仁勋在近期GTC大会上提出了Token工厂经济学——未来的数据中心不再是存储文件的仓库，而是生产Token的工厂。
当Token消耗量到了每天180万亿的量级，Token本身就变成了一种基础生产资料——类似电力之于工业时代，石油之于汽车时代。谁控制了Token的生产、分发和定价链路，谁就控制了AI时代的电网。而未来的定价权不仅在芯片手里，更在并网容量和液冷散热的统筹能力里——因为算力基础设施的物理约束，往往比芯片短缺更难突破。
3月16日，阿里成立全新的Alibaba Token Hub（ATH）事业群，由CEO吴泳铭直接负责，整合通义实验室、千问事业部、百炼MaaS业务线，覆盖从基础模型研发到AI应用的完整链路。吴泳铭在内部信中写道：大量数字化工作将由数以百亿计的AI Agent来支撑，而这些AI Agent将由模型产生的Token支撑运行。
阿里的算盘是打通底层的Token水电话费，腾讯的算盘则打在另一处——生态闭环与高毛利SaaS。
腾讯高层曾多次明确表示AI是全业务的乘数。腾讯云率先敢将Token价格上调450%，其真正的底气在于，混元大模型已经深度接入微信、广告、游戏等数百个内部核心业务。当外部的算力亏本买卖做不下去时，收缩价格战战线、优先保障腾讯庞大内部生态的算力供给，并将外部商业模式从低毛利的IaaS（基础设施）向高毛利的MaaS和SaaS转移，成为了极其清晰的战略。目前腾讯云SaaS收入增速持续跑赢IaaS，正是这一逻辑的兑现。
百度则在全力压榨先发优势与软硬协同的利润空间。百度内部已将AI相关收入目标增速从100%大幅上调至200%，其底层支撑正是昆仑芯的大规模部署带来的成本对冲能力。
阿里重兵押注全栈基础设施，腾讯收网聚焦生态与SaaS，百度死磕软硬协同。但大方向完全一致——短期靠提价与推理效率扩大利润空间，长期靠全链路卡位争夺Token时代的基础设施位置。
值得注意的是，从阿里云官网的涨价列表看，平头哥真武810E芯片涨幅34%，是本轮涨幅最高的产品。真武810E已服务国家电网、中国科学院、小鹏汽车、新浪微博等400多家客户——自研芯片不仅是这轮涨价周期里的成本对冲工具，更是通过软硬协同优化提升Token生产效率、放大利润空间的底层底座。2025年谷歌的价值重估，很大程度上得益于自研TPU的广泛使用；今年，自研芯片在AI涨价周期中的战略价值正在凸显，同样的逻辑正在中国的头部云厂商身上展开。
BAT集体做出了违背祖宗的决定不是因为某一家厂商想涨价，而是整个行业被同一股力量推到了一个临界点——供应链成本涨到了没有人再亏得起的地步，AI需求又爆发到了不需要再用低价吸引用户的地步。
云计算的下半场，不再是比谁更便宜，而是比谁更智能。
火山引擎会不会跟进？
但这场转向中最大的悬念，或许不是已经涨价的三家，而是还没有涨价的那一家——字节跳动旗下的火山引擎。
2024年，正是火山引擎打出低于行业均价99.3%的豆包定价，点燃了那一轮惨烈的降价战。但进入2026年，火山引擎自身的战略也在发生剧变：销售考核从GPU算力转向大模型及AI工具，MaaS业务收入目标从2025年的20亿量级直指百亿规模——它自己也在从卖算力转向卖Token。
这就是火山引擎面对的两难：一边是百亿MaaS收入的激进冲量目标，逻辑上需要继续低价抢市场；另一边是三大同行集体涨价、硬件成本飙升，连亏损换客户的空间都被压缩了。更何况，2025年火山引擎Token消耗总量超过9000万亿，但绝大多数Token都是免费送出的，真正产生扣费的付费流量比例极低。
更深的差异在于底牌厚度。阿里有平头哥真武、百度有昆仑芯，自研算力芯片已形成规模商业化部署，在这轮硬件成本上涨周期中拥有真实的成本对冲能力。火山引擎虽有DPU和算力芯片方向的研发投入，但尚无可规模部署的自研AI算力芯片——面临的可能不只是要不要继续做价格屠夫的战略选择，而是在硬件成本重压、算力受制于人的处境下，被迫跟随整个行业的节奏。下半场的牌桌上，没有自己印钞机的玩家，连打价格战的资格都会被逐渐剥夺。
当整个行业的Token定价开始回归合理水平，火山引擎是继续用亏损冲规模，还是顺势跟涨、把庞大的调用量转化为真实收入？这个选择的答案，将比三家涨价本身更能说明问题——它将决定这轮涨价到底是一次短期的成本传导，还是整个行业告别免费午餐的真正起点。

标签：成本模型厂商算力涨价行业价格火山硬件引擎利润腾讯时代头部芯片 基础设施 逻辑规模百度客户集体降价核心空间产品智能压力部署消耗真武 价格战 供应链

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

以赛促业，AI冲击下的就业“突围”

留给豆包手机的盟友不多了

股价突然跳水，大跌超23%！网传联合创始人走私英伟达AI服务器被捕，上市公司紧急回应

Counterpoint Research：春节促销期间中国智能手机销量同比下降2% 存储供应紧张对整机厂商构成压力

苹果再向中国发展研究基金会捐款

小米汽车卷入专利争议！20人“老头乐小厂”为何进攻“巨头”？

全站最新

以赛促业，AI冲击下的就业“突围”

留给豆包手机的盟友不多了

股价突然跳水，大跌超23%！网传联合创始人走私英伟达AI服务器被捕，上市公司紧急回应

Counterpoint Research：春节促销期间中国智能手机销量同比下降2% 存储供应紧张对整机厂商构成压力

热门推荐

以赛促业，AI冲击下的就业“突围”

留给豆包手机的盟友不多了

股价突然跳水，大跌超23%！网传联合创始人走私英伟达AI服务器被捕，上市公司紧急回应

视频创作全链垂类智能体万兴ReelClaw将上线

天融信发布大模型多模态安全防护网关

Counterpoint Research：春节促销期间中国智能手机销量同比下降2% 存储供应紧张对整机厂商构成压力

苹果再向中国发展研究基金会捐款

小米汽车卷入专利争议！20人“老头乐小厂”为何进攻“巨头”？

何小鹏：IRON机器人今年底量产月产能目标超1000台

雷军，只给笔记本留了十多分钟

用AI，“再造”一个阿里

小米汽车谈为何未公布新一代SU7大定量：锁单量数据“更真实”

干细胞“智造”胰岛！1型糖尿病治疗迎曙光

背刺是一种癌，引发老车主变身黑粉头子

人形机器人之外：一场关于“人作为劳动力”的替代正在发生