2月26日消息,中国春节已过,但AI圈期待的那个“王炸”仍未正式落地。据外媒报道,中国人工智能DeepSeek在推出下一代旗舰模型V4之前,采取了一项打破行业惯例的举措:未向英伟达和AMD等美国芯片巨头提供早期访问权限,而是优先向华为等国内芯片供应商开放了提前访问权。
这一策略调整,在全球AI产业链中投下了一枚深水炸弹。
按照AI行业的常规做法,开发者通常会在重大模型更新前,与英伟达、AMD等头部芯片厂商共享预发布版本,以确保软件能在主流硬件上高效运行。DeepSeek此前也一直与英伟达技术团队保持着紧密合作。
然而,消息人士透露,对于原定于新春假期前后发布的V4模型,DeepSeek此次并未向英伟达与AMD开放测试权限,而是给了华为等中国芯片制造商数周的“优先期”,让其针对自家处理器进行软件优化。英伟达和AMD对此拒绝置评,DeepSeek与华为则尚未予以回应。
有分析指出,此次分发策略的调整,标志着DeepSeek在生态布局上作出了新的取舍:将适配重心前移至国产计算平台,为包括华为在内的本土芯片企业预留充分时间,开展底层指令集、算子库及推理框架层面的深度协同优化。
随着发布临近,DeepSeek V4的技术细节也开始浮出水面。据知名爆料人Legit透露,DeepSeek已开始对其代号为“sealion-lite(海狮轻量版)”的V4预览版本进行闭门内测,参与方均签署了严苛的保密协议。
相较于现有的V3模型,DeepSeek V4将实现跨代际跨越。新模型原生具备多模态处理能力,上下文窗口直接拉升至100万token——这意味着它能一次性“吞下”数本书籍或超长代码库,并进行深度逻辑推理。早期测试反馈显示,V4在生成复杂SVG矢量图形等高难度任务上效果惊艳,性能显著优于目前网页端及App端的在线模型。
据推测,DeepSeek V4很可能是一款万亿参数级别的巨型基础模型。正是由于模型规模的指数级增长导致训练周期拉长,其发布时间较原计划有所延后。
中国开源模型的崛起势头不减。据悉,自2025年1月崭露头角以来,DeepSeek的模型在开源平台Hugging Face上的下载量已超过7500万次。在过去一年发布的模型中,中国模型的下载量在该平台超过了其他所有国家。
随着“下周发布”的传闻愈演愈烈,全球开发者都在屏息以待。一位海外网友的评论颇具代表性:“等不及了,我的Claude订阅3月4日就到期了,希望DeepSeek在那之前能发布他们的模型。”(宜月)





京公网安备 11011402013531号