当前位置：首页 » 资讯 » 新科技 » 正文

为了不被挤下牌桌，OpenAI又开源了

IP属地中国·北京 编辑：陆辰风 时间：2025-08-07 10:33:37

当下开源相对闭源更容易出现 “赢家通吃”的情况，但所有人都在“卷”开源模型的状态可能不会持续太久
文｜《财经》研究员周源吴俊宇黄思韵
编辑｜谢丽容
最早引领全球人工智能大模型风潮的明星创业公司OpenAI近期有了大的产品逻辑和战略转变。
8月5日，OpenAI宣布开源两款权重模型——参数量为1170亿的gpt-oss-120b和参数量210亿的gpt-oss-20b，分别针对云端高推理与边缘低延迟两大场景。这是自2019年开源GPT-2以来，OpenAI再次在开源领域发力。
OpenAI在2015年成立，2022年11月30日，该公司发布的ChatGPT凭借“能流畅对话、写代码、创作内容”迅速红遍全球，5天内用户破百万，2个月破亿，是全球互联网历史上最快达到这一规模的产品（此前TikTok用了9个月）。
时至今日，OpenAI在全球消费级市场的优势其实仍然难以撼动。根据今年八月最新数据，ChatGPT 周活跃用户已达7亿，同比增长4倍，日均消息量突破30亿条。其付费用户数从2024年的300万增至500万，Pro会员和企业版用户贡献了超60%的收入。这一增长速度远超同期谷歌Gemini App（月活4.5 亿）和Anthropic Claude（安卓版首周下载仅1万+）。
但在更加广阔的企业级市场，OpenAI份额正在面临可能进一步被Anthropic（预计今年四季度达35%）和谷歌（20%）蚕食的现实挑战。另外，还有更多来自其他走开源路线的潜在竞争对手在悄然蚕食OpenAI的竞争优势。
开源还是闭源，至少在当下，可能会决定这家公司未来增长潜力和方向。
其实，OpenAI成立之初，秉承的是开源理念。2018年发布GPT-1模型，以及2019年发布的GPT-2模型，在一定程度上都体现了其开源的理念。
真正标志着OpenAI走向闭源路线的时间节点是2020年。2020年5月，OpenAI将GPT-3以论文形式发布，至此，OpenAI不再公开模型的权重、代码或训练数据，开发者无法只能通过OpenAI提供的API接口按规则调用OpenAI的模型。
闭源的商业模式为OpenAI带来不少批评之声，认为这偏离了该公司所宣称的“造福全人类”的初衷，甚至有人调侃OpenAI应改名“CloseAI”。该公司首席执行官山姆・奥特曼（Sam Altman）对此公开解释称，OpenAI的核心使命是确保人工智能的安全，在决定是否开源时，需要谨慎权衡开源可能带来的安全风险。
2025年初，中国AI创业公司DeepSeek（深度求索）推出开源模型DeepSeek R1，引发全球AI产业的高度关注。前谷歌CEO Eric Schmidt在媒体采访时警告：“如果我们不对此采取行动，中国最终将成为开源领域的领导者，而世界的其他地方将走向闭源。”
今年2月，在美国社交平台Reddit的一次公开活动上，有用户问DeepSeek的崛起是否会改变OpenAI对未来模型开源的计划。奥特曼不仅承认DeepSeek的模型“非常好”，并表示他个人认为OpenAI在开源问题上“站在了历史的错误一边”，需要制定一个不同的开源策略。
多大程度的开源？
奥特曼称OpenAI新推出的开源模型为“全球最强开放模型”。
据介绍，两款gpt-oss模型均采用Transformer架构，并利用专家混合（MoE）来减少处理输入所需的活跃参数数量。
其中，gpt-oss-120b 专为生产环境、通用应用和高推理需求而设计，其每个token激活5.1亿参数，虽然总参数量高达1170亿，但却能够在单个英伟达专业数据中心GPU上运行，该模型既能部署在数据中心，也能在高端台式机和笔记本电脑上运行。
gpt-oss-20b则更侧重于本地化和专业化使用场景，激活36亿参数，仅需16GB内存就能运行，大多数现代台式机和笔记本电脑都能够轻松驾驭。
OpenAI两款开源模型一经发布立即引发高度关注，在全球知名AI开源社区“抱抱脸”（Hugging Face）上，两款模型的下载量激增，以至于Hugging Face首席技术官公开请求大家不要急着第一时间下载，否则其服务器会“崩溃”。
Agent公司图灵集市首席技术官陈俊哲告诉我们，尽管OpenAI这次开源模型的性能很吸引他，但对于许多应用场景而言，20B规模的模型成本过高，其显存开销是主流参数模型7B-8B模型的3倍。
陈俊哲所在公司使用的是阿里Qwen系列8B开源模型。他表示，对于中小创业公司而言，小尺寸开源模型更具有吸引力，尽管中国市场也存在30B甚至70B等更大规模的开源模型，但7B-8B模型因其低成本和高灵活性而备受青睐。
两款开源模型均遵循宽松的Apache 2.0开源许可协议，为商业和研究使用提供了极大的自由度。
这也是OpenAI继GPT-2模型之后首次推出开放权重（open-weight）的语言模型。所谓开放权重，是指开发者在使用开源的权重模型时，不必通过OpenAI官方提供的应用程序接口（API）来调用模型功能。
API 接口就像是一个“中间商”，过去开发者若想使用OpenAI的模型，得通过这个接口连接到OpenAI的服务器，按调用次数付费，且所有数据处理和计算都在OpenAI的系统中完成，开发者受限于OpenAI的调用规则、费用标准和数据隐私政策。
而当模型权重开源后，开发者可以把完整的模型文件下载到自己的服务器、电脑等硬件设备上。此时，运行模型、处理数据、生成结果等一系列操作都在本地完成，无需再与OpenAI的服务器产生连接，自然也就不用依赖其API 接口了。
这一变化的意义较大，它让开发者在使用模型时更自由，能自主控制数据处理流程，降低对外部平台的依赖，还能节省API调用的费用，尤其适合有大量处理需求或对数据隐私有高要求的场景。
但OpenAI官方明确表态，不会开源训练数据与完整训练代码。
从技术层面来看，训练数据如同模型的“学习素材”，完整训练代码则是模型构建的“操作指南”。不开源训练数据，使得外界难以知晓gpt-oss模型究竟“学了什么”，模型在训练过程中所使用的数据来源、数据处理方式等关键信息被隐藏。
训练代码的缺失，意味着开发者无法复刻模型的训练过程，不能根据自身需求重新训练模型。例如无法对训练代码进行修改，来适配不同的硬件环境，或是尝试新的训练算法以提升模型性能。
多位行业人士向我们表示，这一做法是OpenAI维护自身优势的重要手段。因为训练数据和完整训练代码是其核心资产，倘若开源，竞争对手可能利用这些资源，快速提升自家模型性能，削弱OpenAI 在市场中的领先地位。
但硬币的另一面是，这种做法意味着开发人员无法获取训练数据和代码，限制了对模型的深入研究，缺少这些关键要素，降低了模型的可验证性与可重现性，无法充分发挥开源的优势。
为了成为更大的赢家？
市场普遍认为，OpenAI此次开源的主要目的是为了扩大自家模型在全球市场的影响力。
近一年，开源模型的市场影响力不断扩张。因为开源模型任何人都能下载、部署、使用。开源模型就像种子，不断被散播并生根发芽，被全球开发者二次训练或部署使用。
对于OpenAI来说，开源模型的推广渠道和此前大不一样。8月6日，OpenAI这两款开源模型很快登陆了亚马逊AWS。这意味着OpenAI获得了全球最大云厂商的“带货能力”，企业客户可以直接在亚马逊AWS上使用这两款模型。且企业自己也可以把OpenAI这两款模型部署到谷歌云、阿里云等其他云平台上，而不是像过去只能在微软Azure上使用OpenAI的模型。
2024年之前，大模型领域一个曾经的共识是，开源模型和闭源模型的性能存在差距。不过，近一年，开源模型正在不断缩小和闭源模型之间的差距。尤其是中国AI创业公司DeepSeek旗下的DeepSeek-R1、阿里旗下的Qwen 3系列都打破了这一刻板印象。
比如DeepSeek-R1和阿里Qwen 3借助开源策略，下载量、调用量、衍生模型数量都在全球领先。截至今年7月，阿里Qwen系列已开源300余个模型，全球下载量超4亿次，Qwen衍生模型数超14万个，是目前全球开源模型的领头羊。
今年6月，阿里云CTO、通义实验室负责人周靖人在魔搭开发者大会群访环节曾对我们表示，一个成功的开源模型生态，其价值绝不止于模型本身，而在于围绕模型构建起的价值网络——包括丰富的应用案例、活跃的社区交流氛围。通过开源，模型厂商可以获得来自全球数千万开发者的宝贵反馈，包括使用体验、Bug报告和功能建议，这种良性的互动对于模型的快速迭代和优化至关重要。
OpenAI重回开源这一举措也意味着，未来AI巨头将更多采取开源闭源两手抓模式，即开源部分基础模型，同时保留更先进、更具商业价值的模型作为核心竞争力。
不过，也只有头部企业或者极少数能持续融资的创业公司能坚持开源。因为开源模型无法直接获得收入。例如，OpenAI在亚马逊AWS上的开源模型，企业客户并不需要为OpenAI支付模型使用和API调用费用，只需要为亚马逊AWS支付算力费用。无法直接获得收入，这是很多企业犹豫是否要开源的重要原因。
从营收来看，OpenAI有长期打“开源牌”的商业基础。
此前有媒体报道，截至今年7月末，OpenAI预计将实现120亿美元的年度经常性收入（ARR，Annual Recurring Revenue）。这一营收规模使得OpenAI成为全球最大的AI创业公司，且远超它的最大竞争对手Anthropic。截至今年7月末，Anthropic的年度经常性收入预计仅为50亿美元。
OpenAI重新开源开放势必影响到全球开源模型竞争格局。
当下AI产业的一大现象是，越来越多中国科技公司参与到全球开源模型竞速中。7月31日，全球知名AI开源社区“抱抱脸”（Hugging Face）趋势热门榜单前10名中，中国大模型占据8席。活跃其中的角色，分别是头部互联网公司阿里、腾讯，和“AI六小虎”
至少在当下，相比闭源，开源更容易出现“赢家通吃”的情况。
但一位头部科技公司技术负责人告诉我们，大家都在“卷”开源模型的状态不会持续太久，“大模型还处于比较早期的阶段，且大公司还没有拿到绝对优势，大家都有机会成为赢家”。
责编 | 杨明慧
封图来源 | 视觉中国

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

游戏直播不太行了，但虎牙突然又行了？

紧盯三个关键领域，强化人工智能科技伦理治理

不拼流量拼品质电商发展新规出炉

虎嗅【作·嗅之星】周榜第307～308期

力箭二号运载火箭首飞成功将探索新型天地运输模式

做知识分享的博主，用微信公众号发布软件打理内容，真的能轻松不少

全站最新

游戏直播不太行了，但虎牙突然又行了？

紧盯三个关键领域，强化人工智能科技伦理治理

不拼流量拼品质电商发展新规出炉

虎嗅【作·嗅之星】周榜第307～308期

热门推荐

游戏直播不太行了，但虎牙突然又行了？

紧盯三个关键领域，强化人工智能科技伦理治理

不拼流量拼品质电商发展新规出炉

虎嗅【作·嗅之星】周榜第307～308期

力箭二号运载火箭首飞成功将探索新型天地运输模式

美“阿耳忒弥斯2号”载人绕月任务打破人类距离地球最远飞行纪录

做知识分享的博主，用微信公众号发布软件打理内容，真的能轻松不少

六部门定调“人工智能+电商”：头部企业挑大梁，大模型重塑消费新体验

腾视科技AI大模型应用：提效、破局与落地，重塑智能新生态

AI应用加速度，市司法局举办WPS政务大模型使用培训

2026年微信小程序商城优选公司：哪家更值得信赖？

AI学会左脚踩右脚自进化？Meta华人新研究改写Agent法则

说说有实力的百度AI搜索服务商、Chat GPT AI搜索及抖音AI搜索合法公司推荐

优推信息：老牌百度关键词排名优化，百家号SEO排名激活沉默用户

位置限定分组小程序：基于地理围栏的精准人员管理