IT之家 2 月 28 日消息,当地时间 2 月 27 日,据《The Information》援引知情人士消息称,meta 在自研 AI 芯片方面遭遇重大挫折,已放弃其最先进的训练芯片项目,并将开发重点转向结构更简单的替代方案。
由于芯片设计难度超出预期,meta 上周决定取消正在开发的高端 AI 训练芯片,并已向 AI 基础设施部门员工通报这一调整。
meta 调整芯片战略的同时,也在加强与现有芯片供应商的合作。据报道,meta 已签署价值数十亿美元的协议,从谷歌租用 AI 芯片。AMD 本周表示,将与 meta 合作部署最多 6GW 的 Instinct AI 芯片,以支持 meta 下一代 AI 基础设施。此外,meta 本月还宣布与英伟达建立跨多代合作关系,将继续在数据中心部署英伟达芯片。
meta 自研芯片属于“meta 训练和推理加速器”(MTIA)项目,目标是降低对外部供应商的依赖,同时减少数据中心运营成本并增强基础设施控制能力。
meta 已放弃其第二代训练芯片 Iris 的一个版本,并随后启动更先进芯片 Olympus 的开发,但该项目同样遭到了夭折的命运。一名参与芯片开发的人员表示,公司内部对能否开发出可与英伟达性能匹敌的芯片持怀疑态度,原因包括开发周期长、设计复杂以及功耗控制难度高。如果功耗无法有效控制,将削弱芯片相对于英伟达产品的竞争力。
在技术架构方面,Iris 采用单指令多数据(SIMD)架构,这种架构更易于硬件设计,但软件开发难度较高。Olympus 则采用单指令多线程(SIMT)架构,与英伟达芯片类似。这种架构更适合 AI 训练软件,但硬件实现复杂度更高。
meta 原计划最早于 2026 年第四季度完成 Olympus 设计,而芯片设计完成后通常仍需至少 9 个月才能实现量产。Olympus 的 GPU 原计划采用 meta 去年收购的 Rivos 的技术,该技术可兼容英伟达的 Cuda 软件生态,而 Cuda 是当前 AI 训练的行业标准。
meta 最初计划基于 Olympus 构建大规模 AI 训练服务器集群,但管理层认为,这一方案存在风险,可能影响公司在与 OpenAI 和谷歌竞争过程中训练新模型的进度。此外,软件成熟度可能不及英伟达生态,而复杂设计也可能增加量产难度。
因此,meta 目前计划继续依赖外部供应商提供的 AI 训练芯片,因为这些芯片的软件生态更加成熟,风险更低。





京公网安备 11011402013531号