今年3月,在美国加州圣何塞会议中心举行的GTC 2025大会上,英伟达创始人兼首席执行官黄仁勋发布了Blackwell Ultra平台,带来了用于取代B200的B300 GPU,另外还有与Grace CPU相结合的GB300,以及一系列围绕这些芯片构建的产品线。
近日英伟达在官方博客上发表了一篇文章,介绍了其Blackwell Ultra平台最出色的AI芯片GB300。目前该款芯片已经量产,并想主要客户发货。虽然只是在Blackwell解决方案基础上做的升级,但是无论性能还是功能都有重大的改进。
GB300仍然属于Blackwell架构的产品,而新一代Blackwell Ultra旨在满足测试时扩展推理的需求。其采用了台积电4NP工艺制造,拥有2080亿个晶体管,两个Die通过带宽10TB/s的NV-HBI高速界面互连,使其作为单芯片那样运行,共拥有160个SM,每个SM拥有128个CUDA核心、4个支持FP8/FP6/NVFP4精度的第五代Tensor核心,总计20,480个CUDA核心和640个Tensor核心。这次英伟达改用了12层堆叠的HBM3E,容量达到了288GB。
GPU与GPU之间通过NVlink 5互连,带宽达到了1.8TB/s,而GPU与CPU之间通过NVlink-C2C连接,带宽为900GB/s。与Blackwell不同的是,Blackwell Ultra首次支持PCIe 6.0,带宽直接翻倍。此外,GB300的功耗增至1400W。
与之前的Blackwell平台产品不同,Blackwell Ultra平台能够支持新的NVFP4,计算性能提高至原来的1.5倍。新标准的精度接近FP8,差异通常小于1%,但是内存占用比FP8减少了1.8倍,与FP16相比减少了3.5倍。