据知情人士透露,全球 AI 领军企业OpenAI近期正积极系统性地寻找英伟达之外的算力替代方案。这一动作源于其对英伟达最新一代 AI 芯片在特定推理环节(尤其是响应速度)表现的失望。
核心痛点:推理速度制约用户体验
OpenAI发现,在代码生成及复杂的软件系统交互用例中,现有硬件的响应速度已成为瓶颈:
战略重心偏移:OpenAI正在将关注点从模型“训练”转向“推理”(即向终端用户输出答案的过程)。
延迟与吞吐:推理阶段的性能直接挂钩用户体验与运营成本。在高带宽、低延迟的特定任务下,传统 GPU 架构因需频繁访问外置显存而产生的延迟,让芯片长时间处于“等数据”状态。
专业用户的高要求:CEO 山姆·奥特曼指出,开发者等专业用户对代码类模型的生成速度极度敏感,而当前的硬件架构限制了相关产品的体验。
替代方案:牵手推理加速“新势力”
为了解决硬件瓶颈,OpenAI计划引入新型硬件来分担未来约10% 的推理算力需求:
引入 Cerebras:OpenAI已与 Cerebras 达成合作。后者的架构在同一块芯片中集成了海量静态存储(SRAM),能极大地缩短访问路径,提升响应速度。
洽谈 Groq:公司此前也曾与 Groq 接触,寻求利用其推理加速特长来优化聊天机器人等 AI 系统。
巨头博弈:原本“板上钉钉”的投资生变
这种技术路线的调整也让OpenAI与长期核心供应商英伟达的关系变得微妙:
千亿交易停滞:双方原本正在洽谈一项涉及1000亿美元 的投资与供货协议(英伟达以芯片换股权),但该谈判已拖延数月。
采购多元化:OpenAI已经与 AMD 等其他厂商签署了新的 GPU 采购或合作协议,进一步分散了对单一供应商的依赖。
竞争压力:相比之下,Anthropic 的 Claude 以及谷歌的 Gemini 更多依赖谷歌自研的 TPU,这种专用芯片在推理任务上的天然优势给了英伟达巨大压力。
尽管双方在公开场合仍维持积极的合作形象,英伟达CEO 黄仁勋也极力否认不和传闻,但随着OpenAI开始真金白银地为第三方推理芯片下单,AI 算力市场的“一超多强”格局正面临重塑。





京公网安备 11011402013531号