今年初的CES 2025上,英伟达公布了Project DIGITS,这是一款紧凑型超级计算机。其中搭载了由英伟达与联发科合作开发的NVIDIA GB10 Grace Blackwell Superchip芯片,由Blackwell GPU和Grace CPU组成,能够运行超过2000亿个参数的大型语言模型。英伟达的DGX Spark是首个搭载该芯片的系统,其他几个合作伙伴也有类似的产品,宣告英伟达正式进军AI PC市场。
据Wccftech报道,近日在Hot Chips 2025上,英伟达更为详细地介绍了NVIDIA GB10 Grace Blackwell Superchip芯片,以及如何将其缩小到“迷你”程度,塞进紧凑的工作站提供给开发人员。
NVIDIA GB10 Grace Blackwell Superchip芯片采用了台积电3nm工艺制造,以及2.5D封装技术,由两个dielet组成,其中CPU和内存子系统部分成为S-dielet,GPU部分成为G-Dielet,TDP为140W。CPU是基于Arm Arch v9.2架构,共有20个内核,分为两个集群,每个内核都有专用的L2缓存,另外每个集群拥有16MB的L3缓存,共32MB。GPU基于Blackwell架构,CUDA核心数量是6144个,拥有24MB的L2缓存,可支持光线追踪和DLSS4,FP32算力为31 TFLOPS,NVFP4算力为1000 TOPS。
进入内存子系统领域,该款SoC支持256-bit的LPDDR5X内存,最高运行速率达9400 MT/s,可提供高达301 GB/s的原始带宽,最大容量可达128GB。系统互联架构采用高性能一致性互联,支持CHI-E一致性协议。通过C2X接口,GPU可访问系统总计600 GB/s的带宽。此外,英伟达还加入了16MB系统级缓存,作为CPU的L4缓存,可在SoC内多个引擎间实现高效节能的数据共享。C2C接口同样具备高带宽与低功耗特性,这得益于英伟达的NVlink互联技术。
NVIDIA GB10 Grace Blackwell Superchip芯片支持PCIe、USB、基于PCIe协议的以太网,可以驱动多达4个显示设备(3个DisplayPort + 1个HDMI),通过DP Alt模式实现最高4K@120Hz输出,而通过HDMI 2.1a可实现最高8K@120Hz输出。