当前位置: 首页 » 资讯 » 新科技 » 正文

小米罗福莉谈Token价格战:建议LLM公司不要盲目压低价格,会导致恶性循环

IP属地 中国·北京 编辑:周琳 IT之家 时间:2026-04-07 22:11:38

IT之家 4 月 7 日消息,小米集团 MiMo 负责人罗福莉昨天在 X 平台发文,谈及最近 AI 业界火热的 Token(IT之家注:词元)价格战。

图源:罗福莉本人社媒账号

罗福莉表示,Anthropic 几天前切断了 Claude 第三方工具订阅通道;并且 MiMo 也在几天前推出了 Token Plan,于是她有感而发:

1、Claude Code 的订阅机制在计算资源分配上设计得非常漂亮。但我认为它并不赚钱甚至可能亏损,除非 API 利润率高出 10 到 20 倍。

我无法精确计算第三方框架接入后带来的损失,但我仔细研究 OpenClaw 的上下文管理后发现它很糟糕。例如在一次用户请求中,OpenClaw 会触发多轮低价值的工具调用,每一次都是独立的 API 请求,而且都携带超长上下文(通常超过 10 万 tokens)。

即便有缓存命中,这种方式仍然非常浪费;在极端情况下,还会提高其他请求的缓存未命中率。

这就导致每个用户实际触发的 API 调用次数往往是 Claude Code 原生框架的数倍。换算成 API 成本很可能是订阅价格的几十倍。这已经不是“差距”,而是“巨大鸿沟”。

2、OpenClaw、OpenCode 等第三方框架仍然可以通过 API 调用 Claude,只不过不能再“搭便车”使用订阅额度。

短期来看,这些智能体的用户会感受到成本压力,费用可能轻松上涨几十倍。但这种压力会迫使上述框架优化上下文管理、提高提示词缓存命中率,减少 Token 浪费。

这种痛苦最终会转化为工程上的自律。

3、我建议各大 LLM 公司,在搞清楚如何设计一个不亏钱的编程订阅方案之前,不要盲目去打价格战。

把 Token 价格压得很低、同时完全开放第三方框架看起来对用户很友好,但这其实就陷入了 Anthropic 刚走出的陷阱。

并且更深层的问题在于,如果用户把注意力消耗在低质量 Agent 框架上,那么面对不稳定且缓慢的推理服务时,就只能使用降级过的节省成本大模型,结果仍然无法完成任务。这对于用户体验、留存来说无异于恶性循环。

4、关于 MiMo 的 Token Plan 计划:它支持第三方工具,按 Token 计费,与 Claude 新推出的额外使用套餐逻辑相同。我们的目标是长期稳定地提供高品质服务,而不是让您冲动消费后弃坑。

从宏观角度看,全球计算资源增长的脚步已跟不上 Agent 带来的 Token 需求增长。真正的出路不是提供更便宜的 Token,而是让“更高效的 Agent 框架” × “更强大且更高效的模型”协同演进。

Anthropic 的这次举措无论是否出于本意,都在推动开源、闭源生态发展,这或许是一件好事。

Agent 时代不属于消耗最多算力的人,而属于最懂得如何高效利用算力的人

标签: 用户 罗福莉 价格战 框架 盲目 浪费 公司 小米 消耗 无法 计算资源 全球 模型 价格 建议 成本 结果 压力 注意力 深层 低质量 任务 闭源 平台 火热 资源分配 工具 自律 逻辑 算力 生态

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。