![]()
出品|虎嗅科技组
作者|宋思杭
编辑|苗正卿
头图|月之暗面
还记得2025年春节,全世界都在为DeepSeek狂欢;不出意外,2026年春节大概率也会再次上演类似的场景。
只不过,这一次行业已经有了充分的预判和心理准备。
1月27日,月之暗面重磅发布K2.5模型,而和这家公司的以往模型发布不同的是,这次创始人杨植麟亲自为K2.5站台——在视频号发布长达4分13秒的视频。
如果只看模型能力,K2.5 实际上是在K2基础上的一次能力补齐和体验升级,并称不上“惊艳”。
但真正让这次发布显得不同寻常的,并不在模型本身,而是杨植麟的亲自站台。
在大模型行业,创始人走到台前,往往并不是为了讲清楚技术细节,而是在一个关键时间点,对外释放信号。当然在杨植麟共4分多钟的视频中,他讲的全是K2.5的新技术,但这本身也是一个信号。
而这个时间点,本身就很微妙,就在 DeepSeek 新一代模型被普遍认为即将发布的前夜。相比之下,Kimi 2.5 的出现,更像是一种提前落子。月之暗面必须要在DeepSeek发布V4或者R2新模型之前做点什么。这也是为了在更大的变量到来之前,先稳住位置。毕竟,从2025年的结果来看,DeepSeek发布后,月之暗面几乎是受打击最大的基座模型公司。
从这个角度看,这次发布,与其说是一场主动进攻,不如说更像一次在春节前完成的防守部署。
K2.5补足了什么?
经历了 2025 年 DeepSeek 带来的正面冲击之后,月之暗面已经完成了全面的方向调整,不仅如此,在K2发布之后,月之暗面也得到了海内外开发者的好评。
和外界仍然习惯把 Kimi 视为“基座模型竞争者”不同,月之暗面在过去一年里,已经明确将重心从单纯追逐模型能力上限,转向编码能力与 Agent 体系,尤其是面向海外市场的 Agent 产品形态。
但这种转向在某种程度上来说也是一种现实选择。因为在基座模型能力加速同质化的背景下,月之暗面需要一条不再完全依赖下一代模型一定更强的生存路径。
也正是在这个前提下,K2.5 的定位才显得清晰。
如果放在做最强模型的叙事里,K2.5 并不成立;但如果放在服务新主线的框架中,它更像一次工程性交付。无论是编码相关能力的强化,还是对 Agent 场景中稳定性、可控性和执行效率的优化,K2.5 的指向性都非常明确,它不是为了证明模型领先,而是为了让模型更好地支撑 Agent 与编码这一条已经确定的路线。
换句话说,K2.5 更像是月之暗面在完成战略转向之后,对外给出的一个确认信号:月之暗面已经开始持续投入,并能够在模型层面形成阶段性成果。
但与此同时,行业真正关心的,并不只是 K2.5。
在 K2 发布之后,月之暗面其实已经预告 K3 很长时间。一个理想的状态当然是,在 DeepSeek 推出 V4 或 R2 之前,率先发布 K3。
因为在大模型竞争中,只要能够抢在对手之前完成代际切换,就能在很大程度上对冲下一次冲击,至少不会在叙事和注意力层面被完全压制。
但问题在于,这种理想状态很难成立。
过去两三年里,无论是 OpenAI,还是 DeepSeek,主力模型的更新周期几乎都在一年左右。原因很简单,当模型规模、训练成本和系统复杂度不断上升后,每一次真正意义上的代际跃迁,都需要更长的训练、验证和工程周期。这已经成为行业内的共识。
而距离 K2 发布至今,仅仅过去半年。在这样的时间窗口内,想要交付一个足以被称为 K3 的模型,这意味着极高的技术与交付风险。
而对于已经把重心放在编码与 Agent 路线上的月之暗面而言,更不可能为了赶时间点,去牺牲下一代模型的完整性。
于是,现实的局面变得非常清楚:K3 仍然是月之暗面真正的关键变量,但它客观上不可能出现在 DeepSeek 下一次更新之前。
在这个前提下,K2.5 的出现,和杨植麟的亲自站台也是为了,在无法提前交付 K3 的情况下,月之暗面必须先用一次可交付的升级,稳住自身在新路线上的存在感。
月之暗面在焦虑什么?
过去一年,大模型行业已经进入新一轮洗牌期。
智谱和MiniMax已经登陆资本市场,另外两家百川智能和零一万物也完成了方向调整,并对外明确了新的选择;而在尚未上市的阵营中,原本并列的两家公司里,最近阶跃星辰也已经明确押注“AI + 终端”路线。
这意味着,真正仍然以“基座模型公司”自我定位的独角兽,只剩下月之暗面。
而这背后,是一个更残酷的现实,基础模型的故事,已经接近阶段性尾声了。
当前的行业共识正在从“谁能做出最强模型”,转向“谁能把模型真正用起来”,因此继续坚持基座模型叙事,反而成了一种更高风险的选择。
但问题在于,月之暗面并非没有意识到这一点。它已经在尝试转向编码能力与 Agent,并把重点放在海外市场。但与已经完成上市或路径切换的同行不同,月之暗面至今仍然无法彻底摆脱对模型本身的依赖。
这正是杨植麟真正焦虑的第一层来源。
一个无法回避的前提是:即便已经上市的大模型公司,也都尚未跑通真正意义上的商业闭环。
大模型究竟该如何规模化商业化,这件事至今没有标准答案。
而在这样的背景下,月之暗面的商业结构显得尤为特殊:它既不依赖 G 端订单,也没有以大 B 私有化部署作为主要收入来源;在国内 C 端,商业化路径同样尚未成立。目前支撑收入的,仍然主要来自海外市场。
这意味着,在相当长一段时间内,月之暗面的商业模式,本质上仍然高度依赖模型能力本身。
而在这种背景下,一旦模型在能力、成本或扩散速度上被对手显著拉开,这种冲击会比对那些已经完成转型或绑定场景的公司来得更直接。
也正因如此,DeepSeek的下一代模型,对月之暗面而言始终是一个无法回避的变量。
这不是因为月之暗面仍想回到正面硬拼基座模型的战场,而是因为在现有商业结构下,它还没有真正摆脱对模型领先性的依赖。
第二层焦虑,则来自转型路径本身的验证压力。
把重心放在编码能力与 Agent,尤其是面向海外市场的 Agent,是一次理性的选择,但这条路径的最大问题在于,验证周期极长。
Agent 能否跑通,不取决于一次发布的模型能力,而取决于真实任务、复杂场景和长期使用反馈。
这使得月之暗面在舆论与市场层面,始终处在一种不对称的位置:DeepSeek可以通过一次模型发布,迅速制造能力跃迁的冲击;而月之暗面却只能用更慢、更工程化的方式,去证明自己路线的正确性。
第三层焦虑,则来自 2025 年春节DeepSeek发布后留下的“阴影”。
那一年春节前后,DeepSeek 的发布不仅改变了技术对比,也迅速改写了行业叙事。对月之暗面而言,那次冲击的影响并不只体现在能力层面,而是在注意力、信心和位置感上,形成了持续效应。
当时间再次逼近春节节点,当 DeepSeek 的下一代模型被普遍认为即将到来,选择提前出牌,本身就是一种对历史经验的回应。
因此,杨植麟真正的焦虑,并不是 K2.5 能不能在能力上压过对手,而是在基座模型叙事逐渐退潮、Agent 路线尚未被完全验证、而下一次外部变量又即将到来之前,月之暗面如何避免再次被推到一个被动的位置。
本文来自虎嗅,原文链接:https://www.huxiu.com/article/4830530.html?f=wyxwapp





京公网安备 11011402013531号