2026年4月24日,DeepSeek V4系列模型在数次延期后终于上线。此次技术发布备受关注,对DeepSeek来说,更是一次艰难的战略突围。
在一众大厂纷纷站队、融资、烧钱投流的喧嚣中,DeepSeek既要应对巨头们从人才到市场的全方位“围猎”,又不得不在算力、入口等维度与它们保持微妙的“合作”。V4的上线,正是这种竞合张力下的产物。
为“干活”而生,但仍有取舍
根据官方公布,V4系列包含V4-Pro和V4-Flash两个版本。这次升级的核心逻辑并非简单追求Benchmark(基准测试)上的领先,而是围绕“让AI真正用得起”来设计产品。1M上下文成为所有官方服务的标配,不再作为高端卖点;V4-Flash输出定价低至2元/百万token,单token算力消耗仅为此前版本的10%至27%,比GPT-5.5低两个数量级,大幅降低了开发者的使用门槛。
在能力定位上,V4从“聊天”转向“干活”的意图明显。DeepSeek内部员工已全面用V4-Pro替代原有编程工具,其交付质量接近Claude Opus 4.6的非思考模式。针对Claude Code、OpenClaw等主流Agent框架的专项适配也已完成。显然,DeepSeek并未发力应用,而是专注于提供高性价比的底层模型。
但DeepSeek官方也坦承了V4的短板,其整体能力仍落后GPT-5.4和Gemini-3.1-Pro约3至6个月,复杂深度推理与Opus 4.6思考模式存在阶段性差距;目前V4暂不支持多模态功能,业内人士分析原因也与算力和现金掣肘有关,团队在多模态训练和Agent优化之间做出了取舍。
这是整个V4发布过程中不得不做出的取舍,在算力和资金面前,这家以理想主义著称的公司不得不务实地做出这样的选择。
华为昇腾扮演“关键先生”
V4发布当天,华为同步宣布昇腾950超节点已全面适配该系列模型,V4-Pro可实现约20ms的单token解码时延。华为称其“重新定义了长文本推理的性能天花板”。英伟达CEO黄仁勋今年1月底曾表示,“DeepSeek首次在华为芯片上线的那一天,对我们来说会是一个可怕的结果。”现在,这个结果已经出现。
为了这一天,DeepSeek团队付出了多次版本延期的代价。根据官方发布的信息,V4开发过程中,团队重写了大量核心代码,完成了从CUDA到华为CANN生态的技术栈迁移。值得注意的是,V4并未向英伟达开放测试,而是优先与华为及寒武纪合作。
算力自主化的另一个信号来自地理维度。DeepSeek近期在内蒙古乌兰察布发布了多个数据中心岗位,月薪开至15-30K·14薪,是当地薪资平均水平的4到6倍。公开信息显示,乌兰察布电价优势明显,当地电价比京津冀低约50%,且年均气温4.3℃可自然制冷近10个月;与此同时,乌兰察布是“东数西算”八大枢纽之一,地理优势明显,距北京直线仅240公里,算力时延控制在4.2毫秒。
根据DeepSeek官方消息,其一期在乌兰察布规划约2万张芯片混用H800和昇腾910,远期扩展至5万张以上。这标志着DeepSeek正从“租用云服务的算法公司”转向“自建算力基础设施的运营商”。一位业内人士评价,这相当于DeepSeek拥有了自己的“算力工厂”,不仅能保证V4的稳定运行,也为未来的V5、V6铺路。
回到V4本身,同样受限于高端算力,目前V4-Pro版的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后价格才会大幅下调。
大厂砸钱挖人,精准到每条技术线
功能上的取舍和算力自主战略背后,是DeepSeek难以避开的激烈的行业竞争。大厂仍采取惯用的砸钱挖人战术。在DeepSeek V4沉默研发的这15个月里,大厂对它的“人才围猎”从未停止,且精准到了每条技术主线。
据36氪、晚点LatePost等多家媒体报道,DeepSeek至少5名核心研发成员确认离职,覆盖了基座模型、推理、OCR、多模态四条核心技术主线。
其中王炳宣,系DeepSeek第一代大语言模型核心作者、公司元老,于2025年底被腾讯挖走;罗福莉,DeepSeek-V3关键开发者,2025年11月正式加入小米,担任小米MiMo大模型负责人,据传雷军以千万年薪招揽(小米及本人未证实);郭达雅,DeepSeek-R1核心研究员、GRPO算法主要提出者,2026年3月离职,随后加入字节跳动Seed团队担任Agent方向负责人,不过字节官方已否认“亿元年薪”传闻;魏浩然,系DeepSeek OCR系列核心作者,于2026年春节前后离职,去向尚未公开;阮翀,多模态成果核心贡献者,从幻方时期即加入DeepSeek,2026年1月官宣加入自动驾驶公司元戎启行,出任首席科学家。
5个人,覆盖了DeepSeek从基模到推理、从OCR到多模态的全部技术命脉。一位杭州某科技企业的创始人兼CEO告诉财闻,大厂资本实力雄厚,但由于组织等“大公司病”,在从0到1的新业务方面往往会慢半拍,而他们最擅长的就是通过高薪挖人来进行业务“复刻”,并与创业公司展开竞争。
大厂的策略清晰而直接,相比之下,DeepSeek由幻方量化支持的期权在缺乏融资的情况下缺少流动性,持有者无法确定其真实价值。一位业内人士称:“DeepSeek的期权在账面上可能是天文数字,在现实中是一张无法兑现的期票。”这种“流动性折价”在人才争夺战中正成为DeepSeek越来越明显的软肋。
对此招商证券国际在最新研报中提出,V4发布后需“密切关注各大模型厂商模型迭代、商业化进展、人才流动等情况”。券商将“人才流动”与“模型迭代”并列作为核心观察指标,这在以往的行业分析中并不多见,这背后是整个AI行业已形成的共识——竞争不仅在算力、算法,更在“人”。
双重围攻:同行的错峰与大厂的市场卡位
除了才“后方堡垒”被攻破的同时,DeepSeek在产品市场层面也面临着“双重围攻”,来自同行的错峰竞争,以及来自大厂的投流封锁。
在DeepSeek多次跳票的窗口期里,同赛道的创业公司选择“抢跑”。智谱和MiniMax在2026年春节前“错峰”发布了新模型GLM 5和M 2.5。《智能涌现》报道一名智谱员工透露,“DeepSeek将在春节发模型”的传言一出,算法团队立刻被要求“尽早”发布。MiniMax的一名员工也表示,港股IPO庆功酒的宿醉还没褪去,算法团队就自觉回到了工位上。
“错峰”的核心逻辑是避险,“如果比DeepSeek晚发,性能不如它们,会影响股价;但不发,也会影响股价,”上述员工表示,“影响最小的办法,是早发。”V4发布当日,智谱和MiniMax的股价应声下跌,市场对DeepSeek重估行业标准的恐惧可见一斑。
相比同行的“抢跑”,互联网大厂的竞争更加系统化,资本和入口成了挤压DeepSeek的市场空间两个武器。
首先是投流大战。 2026年春节期间,字节跳动投入10亿元将豆包送上春晚舞台;阿里千问豪掷30亿元请用户喝奶茶;腾讯元宝撒10亿元红包。三大厂在短短一个月内烧掉50亿元,目的只有一个,就是抢占C端用户心智。相比之下,DeepSeek几乎没有任何市场投放预算,完全依赖口碑传播。
其次是入口封锁。 腾讯元宝虽然接入了DeepSeek,但在微信、QQ等核心场景中,腾讯优先推荐的是自家的混元模型;字节跳动的豆包在抖音、今日头条中有天然入口优势;阿里的千问则在钉钉、淘宝中深度集成。一位开发者告诉财闻:“在阿里云上,千问的推荐位永远在第一位,DeepSeek要翻好几页才能找到。”这种隐形的“入口倾斜”,让没有自有流量入口的DeepSeek在用户触达上处于天然劣势。
在巨头阴影下寻找合作空间
然而,DeepSeek并非只是在被动应对这些竞争。在另一个维度上,它也在主动寻求与大厂的“合作”,以换取生存和发展的空间。
最典型的案例是与腾讯的合作。腾讯元宝已深度绑定DeepSeek模型,其用户量暴涨与这一合作有直接因果关系,据元宝官方数据,自2025年2月接入DeepSeek以来,用户规模逐步扩大,2025年12月14日当天使用量达到新高,较年初增长超过100倍。对于DeepSeek而言,腾讯的社交和办公场景,微信、QQ、腾讯会议、企业微信是其Agent技术落地的天然试验田;对于腾讯而言,元宝借助DeepSeek的技术能力,迅速缩小了与竞争对手的差距。
与阿里的关系则更加微妙。虽然通义千问是DeepSeek的直接竞品,但阿里云作为算力基础设施方,与DeepSeek在乌兰察布等地的数据中心建设上存在广阔的合作空间。更关键的是,阿里的通义千问系列模型曾作为DeepSeek蒸馏模型的底座,DeepSeek-R1-Distill-Qwen系列证明了双方在开源生态上的交集。
在这样的竞合中,DeepSeek似乎也做出了一个决定性的转变,开始在融资上松口。
2026年4月中旬,多家媒体报道DeepSeek正在洽谈首轮外部融资。据《The Information》率先报道,融资谈判涉及阿里巴巴和腾讯,DeepSeek的估值据称在短短几天内从100亿美元翻倍至200亿美元。《财经》进一步报道称,两家预计合计投资18亿美元,但交易方案尚未完全敲定。
但据澎湃新闻报道,知情人士否认了阿里腾讯投资的消息,表示“相关传言不实”。有媒体报道称,“梁文锋的电话被投资人打爆了。”一位上海的科技圈的投资人告诉财闻,这种说法基本属实,大家都想投DeepSeek,但资本进入以后,DeepSeek能否在战略上完全自主就不一定了,多少会受到一些影响。所以,DeepSeek的融资一定需要一个长期和深入的沟通过程。
2023年,梁文锋拒绝了所有外部投资,坚持独立发展。他曾直言“VC谈不到一块去”。三年后,核心人才出走、V4延宕再三、国产算力适配工程量远超预期——这些纯粹的技术理想,终究要为算力账单和人才账单买单。
据《智能涌现》报道,DeepSeek转向融资的外部导火索之一,与腾讯的投资态度有关。在开放融资前,梁文锋和马化腾曾就独家注资有过几次商谈,但“给腾讯20%股份的条件,没有得到梁文锋的同意”。这也解释了为何最终的融资方案是两家同时入局——梁文锋显然不希望任何一家大厂获得足以影响决策的股权比例。
如果融资成真,DeepSeek或将获得阿里云计算资源的优先保障。
招商证券国际在最新研报中指出,DeepSeek的上述举措中,“龙头云厂商,阿里、腾讯、华为等将直接受益,MaaS平台收入持续提升”。这将是一个深层次的利益绑定,无论DeepSeek最终拿到谁的钱,它都已经成为所有云厂商必须接入的“优质模型供应商”。





京公网安备 11011402013531号