当前位置：首页 » 资讯 » 新科技 » 正文

被大厂围猎也与其合作，竞合中的DeepSeek V4是怎么上线的

IP属地中国·北京 财闻 时间：2026-04-25 13:09:08

2026年4月24日，DeepSeek V4系列模型在数次延期后终于上线。此次技术发布备受关注，对DeepSeek来说，更是一次艰难的战略突围。
在一众大厂纷纷站队、融资、烧钱投流的喧嚣中，DeepSeek既要应对巨头们从人才到市场的全方位“围猎”，又不得不在算力、入口等维度与它们保持微妙的“合作”。V4的上线，正是这种竞合张力下的产物。
为“干活”而生，但仍有取舍
根据官方公布，V4系列包含V4-Pro和V4-Flash两个版本。这次升级的核心逻辑并非简单追求Benchmark（基准测试）上的领先，而是围绕“让AI真正用得起”来设计产品。1M上下文成为所有官方服务的标配，不再作为高端卖点；V4-Flash输出定价低至2元/百万token，单token算力消耗仅为此前版本的10%至27%，比GPT-5.5低两个数量级，大幅降低了开发者的使用门槛。
在能力定位上，V4从“聊天”转向“干活”的意图明显。DeepSeek内部员工已全面用V4-Pro替代原有编程工具，其交付质量接近Claude Opus 4.6的非思考模式。针对Claude Code、OpenClaw等主流Agent框架的专项适配也已完成。显然，DeepSeek并未发力应用，而是专注于提供高性价比的底层模型。
但DeepSeek官方也坦承了V4的短板，其整体能力仍落后GPT-5.4和Gemini-3.1-Pro约3至6个月，复杂深度推理与Opus 4.6思考模式存在阶段性差距；目前V4暂不支持多模态功能，业内人士分析原因也与算力和现金掣肘有关，团队在多模态训练和Agent优化之间做出了取舍。
这是整个V4发布过程中不得不做出的取舍，在算力和资金面前，这家以理想主义著称的公司不得不务实地做出这样的选择。
华为昇腾扮演“关键先生”
V4发布当天，华为同步宣布昇腾950超节点已全面适配该系列模型，V4-Pro可实现约20ms的单token解码时延。华为称其“重新定义了长文本推理的性能天花板”。英伟达CEO黄仁勋今年1月底曾表示，“DeepSeek首次在华为芯片上线的那一天，对我们来说会是一个可怕的结果。”现在，这个结果已经出现。
为了这一天，DeepSeek团队付出了多次版本延期的代价。根据官方发布的信息，V4开发过程中，团队重写了大量核心代码，完成了从CUDA到华为CANN生态的技术栈迁移。值得注意的是，V4并未向英伟达开放测试，而是优先与华为及寒武纪合作。
算力自主化的另一个信号来自地理维度。DeepSeek近期在内蒙古乌兰察布发布了多个数据中心岗位，月薪开至15-30K·14薪，是当地薪资平均水平的4到6倍。公开信息显示，乌兰察布电价优势明显，当地电价比京津冀低约50%，且年均气温4.3℃可自然制冷近10个月；与此同时，乌兰察布是“东数西算”八大枢纽之一，地理优势明显，距北京直线仅240公里，算力时延控制在4.2毫秒。
根据DeepSeek官方消息，其一期在乌兰察布规划约2万张芯片混用H800和昇腾910，远期扩展至5万张以上。这标志着DeepSeek正从“租用云服务的算法公司”转向“自建算力基础设施的运营商”。一位业内人士评价，这相当于DeepSeek拥有了自己的“算力工厂”，不仅能保证V4的稳定运行，也为未来的V5、V6铺路。
回到V4本身，同样受限于高端算力，目前V4-Pro版的服务吞吐十分有限，预计下半年昇腾950超节点批量上市后价格才会大幅下调。
大厂砸钱挖人，精准到每条技术线
功能上的取舍和算力自主战略背后，是DeepSeek难以避开的激烈的行业竞争。大厂仍采取惯用的砸钱挖人战术。在DeepSeek V4沉默研发的这15个月里，大厂对它的“人才围猎”从未停止，且精准到了每条技术主线。
据36氪、晚点LatePost等多家媒体报道，DeepSeek至少5名核心研发成员确认离职，覆盖了基座模型、推理、OCR、多模态四条核心技术主线。
其中王炳宣，系DeepSeek第一代大语言模型核心作者、公司元老，于2025年底被腾讯挖走；罗福莉，DeepSeek-V3关键开发者，2025年11月正式加入小米，担任小米MiMo大模型负责人，据传雷军以千万年薪招揽（小米及本人未证实）；郭达雅，DeepSeek-R1核心研究员、GRPO算法主要提出者，2026年3月离职，随后加入字节跳动Seed团队担任Agent方向负责人，不过字节官方已否认“亿元年薪”传闻；魏浩然，系DeepSeek OCR系列核心作者，于2026年春节前后离职，去向尚未公开；阮翀，多模态成果核心贡献者，从幻方时期即加入DeepSeek，2026年1月官宣加入自动驾驶公司元戎启行，出任首席科学家。
5个人，覆盖了DeepSeek从基模到推理、从OCR到多模态的全部技术命脉。一位杭州某科技企业的创始人兼CEO告诉财闻，大厂资本实力雄厚，但由于组织等“大公司病”，在从0到1的新业务方面往往会慢半拍，而他们最擅长的就是通过高薪挖人来进行业务“复刻”，并与创业公司展开竞争。
大厂的策略清晰而直接，相比之下，DeepSeek由幻方量化支持的期权在缺乏融资的情况下缺少流动性，持有者无法确定其真实价值。一位业内人士称：“DeepSeek的期权在账面上可能是天文数字，在现实中是一张无法兑现的期票。”这种“流动性折价”在人才争夺战中正成为DeepSeek越来越明显的软肋。
对此招商证券国际在最新研报中提出，V4发布后需“密切关注各大模型厂商模型迭代、商业化进展、人才流动等情况”。券商将“人才流动”与“模型迭代”并列作为核心观察指标，这在以往的行业分析中并不多见，这背后是整个AI行业已形成的共识——竞争不仅在算力、算法，更在“人”。
双重围攻：同行的错峰与大厂的市场卡位
除了才“后方堡垒”被攻破的同时，DeepSeek在产品市场层面也面临着“双重围攻”，来自同行的错峰竞争，以及来自大厂的投流封锁。
在DeepSeek多次跳票的窗口期里，同赛道的创业公司选择“抢跑”。智谱和MiniMax在2026年春节前“错峰”发布了新模型GLM 5和M 2.5。《智能涌现》报道一名智谱员工透露，“DeepSeek将在春节发模型”的传言一出，算法团队立刻被要求“尽早”发布。MiniMax的一名员工也表示，港股IPO庆功酒的宿醉还没褪去，算法团队就自觉回到了工位上。
“错峰”的核心逻辑是避险，“如果比DeepSeek晚发，性能不如它们，会影响股价；但不发，也会影响股价，”上述员工表示，“影响最小的办法，是早发。”V4发布当日，智谱和MiniMax的股价应声下跌，市场对DeepSeek重估行业标准的恐惧可见一斑。
相比同行的“抢跑”，互联网大厂的竞争更加系统化，资本和入口成了挤压DeepSeek的市场空间两个武器。
首先是投流大战。 2026年春节期间，字节跳动投入10亿元将豆包送上春晚舞台；阿里千问豪掷30亿元请用户喝奶茶；腾讯元宝撒10亿元红包。三大厂在短短一个月内烧掉50亿元，目的只有一个，就是抢占C端用户心智。相比之下，DeepSeek几乎没有任何市场投放预算，完全依赖口碑传播。
其次是入口封锁。腾讯元宝虽然接入了DeepSeek，但在微信、QQ等核心场景中，腾讯优先推荐的是自家的混元模型；字节跳动的豆包在抖音、今日头条中有天然入口优势；阿里的千问则在钉钉、淘宝中深度集成。一位开发者告诉财闻：“在阿里云上，千问的推荐位永远在第一位，DeepSeek要翻好几页才能找到。”这种隐形的“入口倾斜”，让没有自有流量入口的DeepSeek在用户触达上处于天然劣势。
在巨头阴影下寻找合作空间
然而，DeepSeek并非只是在被动应对这些竞争。在另一个维度上，它也在主动寻求与大厂的“合作”，以换取生存和发展的空间。
最典型的案例是与腾讯的合作。腾讯元宝已深度绑定DeepSeek模型，其用户量暴涨与这一合作有直接因果关系，据元宝官方数据，自2025年2月接入DeepSeek以来，用户规模逐步扩大，2025年12月14日当天使用量达到新高，较年初增长超过100倍。对于DeepSeek而言，腾讯的社交和办公场景，微信、QQ、腾讯会议、企业微信是其Agent技术落地的天然试验田；对于腾讯而言，元宝借助DeepSeek的技术能力，迅速缩小了与竞争对手的差距。
与阿里的关系则更加微妙。虽然通义千问是DeepSeek的直接竞品，但阿里云作为算力基础设施方，与DeepSeek在乌兰察布等地的数据中心建设上存在广阔的合作空间。更关键的是，阿里的通义千问系列模型曾作为DeepSeek蒸馏模型的底座，DeepSeek-R1-Distill-Qwen系列证明了双方在开源生态上的交集。
在这样的竞合中，DeepSeek似乎也做出了一个决定性的转变，开始在融资上松口。
2026年4月中旬，多家媒体报道DeepSeek正在洽谈首轮外部融资。据《The Information》率先报道，融资谈判涉及阿里巴巴和腾讯，DeepSeek的估值据称在短短几天内从100亿美元翻倍至200亿美元。《财经》进一步报道称，两家预计合计投资18亿美元，但交易方案尚未完全敲定。
但据澎湃新闻报道，知情人士否认了阿里腾讯投资的消息，表示“相关传言不实”。有媒体报道称，“梁文锋的电话被投资人打爆了。”一位上海的科技圈的投资人告诉财闻，这种说法基本属实，大家都想投DeepSeek，但资本进入以后，DeepSeek能否在战略上完全自主就不一定了，多少会受到一些影响。所以，DeepSeek的融资一定需要一个长期和深入的沟通过程。
2023年，梁文锋拒绝了所有外部投资，坚持独立发展。他曾直言“VC谈不到一块去”。三年后，核心人才出走、V4延宕再三、国产算力适配工程量远超预期——这些纯粹的技术理想，终究要为算力账单和人才账单买单。
据《智能涌现》报道，DeepSeek转向融资的外部导火索之一，与腾讯的投资态度有关。在开放融资前，梁文锋和马化腾曾就独家注资有过几次商谈，但“给腾讯20%股份的条件，没有得到梁文锋的同意”。这也解释了为何最终的融资方案是两家同时入局——梁文锋显然不希望任何一家大厂获得足以影响决策的股权比例。
如果融资成真，DeepSeek或将获得阿里云计算资源的优先保障。
招商证券国际在最新研报中指出，DeepSeek的上述举措中，“龙头云厂商，阿里、腾讯、华为等将直接受益，MaaS平台收入持续提升”。这将是一个深层次的利益绑定，无论DeepSeek最终拿到谁的钱，它都已经成为所有云厂商必须接入的“优质模型供应商”。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

与邓亚萍对打不落下风，人形机器人全自主打乒乓，30厘米范围命中率91%

提升50%，消息称苹果iPhone 18标准版配12GB内存

与邓亚萍对打不落下风，人形机器人全自主打乒乓，30厘米范围命中率91%

美股科技芯片集体飙升，闪迪年内涨超320%，英特尔大涨23%，黄金白银反弹，美国对伊朗实施金融制裁

“大空头”Burry押注半导体回调，买入SOXX看跌期权

解读｜我国太空算力产业处于怎样阶段？啥时候能规模商用？

全站最新

与邓亚萍对打不落下风，人形机器人全自主打乒乓，30厘米范围命中率91%

提升50%，消息称苹果iPhone 18标准版配12GB内存

与邓亚萍对打不落下风，人形机器人全自主打乒乓，30厘米范围命中率91%

美股科技芯片集体飙升，闪迪年内涨超320%，英特尔大涨23%，黄金白银反弹，美国对伊朗实施金融制裁

热门推荐

OPPO Find X9s Pro今日开售：售价5299元起

豆神教育与微软 Azure 携手打造 AI 短剧平台

小米YU7 GT官宣5月底发布：1003PS最大马力 705km CLTC续航

英伟达 CEO 黄仁勋推动全员使用 OpenAI Codex 编程工具

独角兽人才保卫战升级:DeepSeek以200亿美元高估值融资应对大厂挖角

微软首次向员工提供退休买断方案，受 AI 浪潮推动

小米Vision GT合金车模开售售价199元

特斯拉宣布车载语音接入豆包

Soul 开源实时数字人生成模型SoulXFlashTalk 实现亚秒级延迟

OpenAI与Anthropic的阴影:Cursor500亿美元融资为何遭大厂投资者拒绝

美团秘密试水万亿级 AI 大模型！目前仅对受邀用户开放

寒武纪成功适配 DeepSeek-V4，推动 AI 模型高效运行

九成游戏开发商悄然使用 AI 技术，谷歌高管揭秘行业现状

PerplexityCEO 称 AI 浪潮将强化而非取代iPhone的核心地位

谷歌 DeepMind 推出解耦式 DiLoCo：提升异步训练架构，容忍硬件故障