近日,NVIDIA宣布其AI与高性能计算领域明星产品Blackwell GPU的升级版本——Blackwell Ultra,也就是B300和GB300,预计将于今年晚些时候推出。紧接着,将迎来全新的“Rubin”GPU。其中,GB300 GPU作为首次支持PCIe 6.0的GPU,将带来高达50%的性能提升,同时功耗高达1400W。

Blackwell Ultra采用台积电4NP工艺制造,拥有2080亿个晶体管,采用两个Die通过NV-HBI高速界面互连(带宽10TB/s),配备了总计160个SM单元(每个包含128个CUDA核心)和640个第五代Tensor核心,共享完全一致性的二级缓存。GPU间通过1.8TB/s带宽的第五代NVlink互连,而GPU与CPU之间的NVlink-C2C通道带宽为900GB/s,这些技术特点与前代产品保持一致。

Blackwell Ultra的亮点之一是首次支持PCIe 6.0,这将使可用带宽直接翻倍,同时HBM3E内存容量从192GB增加到288GB(带宽8TB/s)。不过,这一升级也带来了功耗的增加,最大功耗达到了1400W。
性能方面,Blackwell Ultra的NVFP4 dense稠密性能提升了50%,达到了15PFlops,而sparse稀疏性能保持在20PFlops。此外,SFU(特殊功能单元)EX2下的注意力加速能力也从5TF/s提升至10.7TF/s,翻了一番还多。FP8、FP16、TF16等数据格式的性能则基本没有变化。
Blackwell Ultra的主要部署形态将是GB300 NV72服务器,采用液冷机架,每个节点包含两颗B300 GPU和一颗Grace GPU。这一升级版的推出,将为AI和HPC领域带来更加高效和强大的计算能力。(Suky)