英伟达创始人兼首席执行官黄仁勋在去年COMPUTEX 2024主题演讲中已确认,下一代数据中心GPU架构名为“Rubin”。到了今年3月的GTC 2025大会,英伟达更新数据中心GPU路线图的同时,还介绍了新一代Vera Rubin NVL144平台。
据Wccftech报道,英伟达及其合作伙伴已经在为下一代“Vera Rubin”服务器产品做准备,其中富士康就已经启动了Vera Rubin NVL 144 MGX的开发工作,计划2026年下半年进入量产阶段。
目前富士康主要负责GB200 Blackwell AI服务器的生产,承担了约60%的产能,随着年末GB300 Blackwell Ultra产品组合的量产,新产品将占据2026年上半年很大部分出货量。根据预期的时间表,Vera Rubin将在GB300 Blackwell Ultra上市后仅六到八个月就出现,可见英伟达的迭代有多么激进。
相比于Blackwell Ultra B300 NVL72,在同一配置数量下(144个GPU芯片),Vera Rubin NVL144提供的FP4计算性能将从1.1 PFLOPS提升至3.6 PFLOPS。虽然每个GPU对应的显存都是288GB,但是由于从HBM3E升级至HBM4,带宽也将从8TB/s提升至13TB/s。英伟达还会引入更快的NVlink,将总吞吐量提高一倍,达到260TB/s, 机架之前新的ConnectX-9链路将达到28.8TB/s。
Vera Rubin NVL144另外一个重要更新是升级了CPU,以Vera CPU取代了当前的Grace CPU。Vera将是一个相对小巧紧凑的CPU,拥有88个自定义Arm内核,共176线程,另外还具有一个1.8TB/s NVlink核心到核心接口,用于与Rubin GPU之间的连接。