2025 年末,一份来自斯坦福大学人本人工智能研究院(Stanford Institute for Human-Centered Artificial Intelligence,简称 HAI)与 DigiChina 项目联合发布了一项政策简报,对中国开放权重 AI 模型的全球崛起这一在硅谷引发热议却鲜少被系统分析的话题进行了深入解读。
这份题为《超越 DeepSeek:中国多元化的开放权重 AI 生态系统及其政策影响》的报告,发布于 12 月初,由 Caroline Meinhardt、Sabina Nong、Graham Webster 等五位研究者联合撰写。
![]()
图丨相关报告(HAI)
报告试图厘清一个现实:当 DeepSeek 在今年 1 月以一款推理模型震惊全球投资者、让英伟达市值单日蒸发近千亿美元时,这家杭州初创公司并非中国 AI 领域的唯一选手。它只是一个更庞大、更多元生态系统的冰山一角。
从追赶到领跑
报告援引的多项数据指向一个明确结论:在开源大模型领域,中国已从追赶者变为领跑者。所谓开放权重,指的是模型的参数权重可供下载、使用和修改,开发者能够在官方应用或 API 之外独立运行这些模型,并根据自身需求进行调整。
根据 Hugging Face 平台的下载统计,阿里巴巴旗下的 Qwen(通义千问)模型系列在 2025 年 9 月正式超越 meta 的 Llama,成为该平台下载量最高的大语言模型家族。截至 12 月中旬,Qwen 累计下载量已达约 3.85 亿次,而 Llama 约为 3.46 亿次。另一组数据同样值得关注:2024 年 8 月至 2025 年 8 月间,中国开发者的模型下载量占 Hugging Face 总下载量的 17.1%,首次超过美国的 15.8%。这组数据由麻省理工学院与 Hugging Face 联合追踪,经 ATOM 项目分析后公布。
![]()
图丨开源模型的累积下载量(HAI)
衍生模型的增长曲线更能说明问题。自 2025 年 1 月起,基于 Qwen 和 DeepSeek 的衍生模型上传数量持续攀升,到 9 月份时,中国模型的衍生版本已占 Hugging Face 当月新增衍生模型的 63%。这意味着全球开发者社区正在以前所未有的速度围绕中国模型构建应用生态。
报告重点剖析了四个具有代表性的中国模型家族。
Qwen 由阿里云开发,定位于多语言和多模态能力最强的通用模型,支持 119 种语言,采用 Apache 2.0 许可证开源;DeepSeek-R1 以推理能力见长,在数学和复杂问题求解方面表现突出,同时也提供了多个蒸馏版本供资源受限的开发者使用;月之暗面(Moonshot AI)的 Kimi K2 聚焦于代码生成和智能体任务,强调快速推理;智谱 AI(现更名为 Z.ai)的 GLM-4.5 则走均衡路线,通过多专家训练整合推理、编程和视觉能力。
![]()
(HAI)
芯片受限下的效率优先策略
从技术架构看,这些模型普遍采用了混合专家(Mixture of Experts,MoE)架构。MoE 的核心优势在于效率,它能让模型在有限的计算资源下获得更好的性能,训练和推理速度都更快。这并非巧合。
由于美国自 2022 年起对先进 AI 芯片实施出口管制,中国开发者被迫在算力受限的条件下寻找替代方案。DeepSeek 在 2024 年底和 2025 年初发布的模型,正是 MoE 架构的标杆应用。以 DeepSeek-V3 为例,虽然总参数量高达 6,710 亿,但单次推理仅激活 370 亿参数,既保证了性能,又大幅降低了运行成本。
另一个值得关注的转变是许可证条款的自由化。
2024 年发布的 Qwen 2.5 曾对最小和最大规格的模型施加了研究用途限制,同期的 DeepSeek V3 也限制了商业使用和再分发。但到了 2025 年,Qwen3 和 DeepSeek R1 全部采用了最宽松的开源许可证,前者是 Apache 2.0,后者是 MIT License。这种转变的背后,既有吸引全球开发者社区的商业考量,也有中国开发者希望借开放姿态在国际 AI 圈建立学术信誉的诉求。
有意思的是,这场开放潮流甚至影响了此前坚持闭源路线的玩家。百度 CEO 李彦宏曾是中国科技圈里最坚定的闭源拥趸,他多次公开强调私有模型的商业优势。然而到了 2025 年 6 月,百度还是向市场妥协,将旗舰产品文心一言(ERNIE)4.5 以开放权重形式发布。用李彦宏自己的话说:“当模型开源时,人们出于好奇自然想尝试一下。”
政策支持与商业模式
报告作者们特别指出,中国官方在开放权重 AI 发展中扮演的角色复杂而微妙。顶层设计的支持确实存在:早在 2017 年的《新一代人工智能发展规划》中,“开源”和“开放”就被明确列为推动国家创新战略的关键词汇。
2023 年 10 月发布的《全球人工智能治理倡议》和 2025 年 7 月发布的《全球人工智能治理行动计划》,则将开源 AI 提升至国际话语权争夺的高度,强调“平等的 AI 发展和使用权”,与美国的出口管制形成对比。
但报告同时也提醒读者警惕过度简化。DeepSeek 的成功似乎与政府扶持关系不大,这家公司脱胎于私募量化基金幻方,直到 V3 发布引发广泛关注后,其创始人梁文锋才进入更广泛的公众视野。
换句话说,中国开放权重 AI 的繁荣更多是市场竞争、人才积累和工程文化共同作用的结果,而非自上而下的规划产物。
当然,政府的角色也并非完全缺席。地方政府正在为参与开源社区的 AI 组织和项目提供定向财政支持;学术机构被鼓励将开源贡献纳入科研绩效考核;算力基础设施的建设也得到了国家层面的资源倾斜。据不完全统计,已有不少地方公共服务部门将 DeepSeek 模型的本地化版本集成到相关系统中,这些系统通常由数据管理部门与技术伙伴负责部署和微调。
从商业模式角度看,中国开放权重模型开发者正在探索多元化的变现路径,但长期的规模化兑现与可持续性仍有待市场检验。
阿里巴巴作为云服务提供商,将 Qwen 定位为“AI 操作系统”,试图通过企业和政府客户对模型的采用带动云计算业务增长,HP、阿斯利康据称已成为其客户。新加坡国家 AI 计划选择基于 Qwen3 构建旗舰模型,可能为阿里云带来东南亚市场的商业流量。
DeepSeek 和智谱则走轻资产路线,没有自建大规模云基础设施,而是采取协作部署策略,为不同云和算力提供商的客户提供本地化服务。总体而言,与西方同行类似,中国开发者目前仍依赖间接变现:通过广泛采用的开放模型培育用户基础,再将其引导至付费产品和服务。
老调子还没唱完
报告最后用相当篇幅讨论了政策影响,归纳为四个维度:全球获取与依赖性、AI 治理、AI 安全、地缘政治竞争,毫无疑问的又是美国智库讨论中国技术议题时的标准模板。
关于技术获取,报告指出高性能中国模型的广泛可用,为资源有限的低收入和中等收入国家提供了获取先进 AI 能力的新路径。当模型性能趋同于前沿水平时,这些国家的采用者可能更看重负担得起、稳定可靠的服务,而非追逐最高基准分数。
中国模型“够好用”、许可证宽松、使用成本低,恰好契合这一需求。这一逻辑在发达国家同样适用:Airbnb CEO Brian Chesky 在 11 月透露,公司倾向于使用 Qwen 而非 ChatGPT 为客服聊天机器人供电,原因很简单:“又快又便宜”。
治理和安全维度则再次搬出了那些熟悉的论调。报告声称使用中国模型可能“继承内置的内容审查逻辑”,数据“可能物理传输至中国”,面临“被政府或商业竞争对手获取的风险”。在安全层面,报告引用美国政府 AI 测试中心 CAISI 的评估称 DeepSeek 模型被越狱攻击突破的概率是美国同类模型的 12 倍。
最后一个维度依旧是地缘政治竞争。DeepSeek R1 的发布直接改变了美国对开放权重 AI 的政策态度。特朗普总统称其为“警醒时刻”,白宫 AI 事务负责人 David Sacks 则将其作为推行联邦层面 AI 去监管政策的依据。
2025 年 7 月,白宫发布《美国 AI 行动计划》,将开放权重模型提升为战略资产,同时强调加强对中国等对手的出口管制。一个月后,OpenAI 时隔近六年首次发布开放权重模型,采用 Apache 2.0 许可证——Sam Altman 在与记者的晚餐中坦承,中国开源模型的竞争是促使他们做出这一决定的重要因素:“如果我们不这么做,世界将主要建立在中国开源模型之上。这确实是我们决策中的一个重要考量。”
当然,尽管这份报告离不开这些模板化的框架,但其价值仍在于它提供了一个相对完整的图景:中国开放权重 AI 生态系统的参与者多元,包括 DeepSeek、阿里巴巴这样的明星,也包括智谱、月之暗面、百川、零一万物等一众“小巨头”,以及北京智源人工智能研究院这样的非营利机构;它们的技术路线各有侧重,许可证策略趋向宽松,商业模式仍在摸索;政府支持确实存在,但并非唯一驱动力;全球扩散已成事实,政策影响正在显现。
对于那些仍将 DeepSeek 视为“中国 AI 的全部故事”的观察者而言,这份报告是一次必要的校准。而对于那些试图以简单的“赶超”或“落后”叙事框定中美 AI 竞争的人来说,它提供了更多需要消化的复杂性:当模型能力差距缩小,真正的竞争会越来越像生态竞争、工程竞争、成本竞争与合规竞争叠加的系统战。把这些变量看清楚,才更接近“中文模型是否超越全球同行”这个问题在产业层面的真实答案。
参考资料:
1.https://hai.stanford.edu/policy/beyond-deepseek-chinas-diverse-open-weight-ai-ecosystem-and-its-policy-implications
运营/排版:何晨龙





京公网安备 11011402013531号