当前位置: 首页 » 资讯 » 新科技 » 正文

老黄发布Vera Rubin超级芯片!算力狂飙3倍,锁定美国核武实验室

IP属地 中国·北京 DeepTech深科技 时间:2025-10-29 12:19:48

当地时间 10 月 28 日,在英伟达秋季 GTC 大会上,英伟达首席执行官黄仁勋展示了最新的 Vera Rubin 超级计算平台,英伟达直呼其为“超级芯片(Superchip)”。


图 | 黄仁勋展示最新的 Vera Rubin 样品(英伟达)

Vera Rubin,这一名称来自著名天文学家薇拉·鲁宾(Vera Rubin),象征着对探索宇宙与科学前沿的致敬。

该平台由全新的 Vera CPU 与 Rubin GPU 共同组成,目标是同时支撑人工智能大模型训练、科学计算与国家级超级计算任务。

首批系统将部署在美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory,LANL),并由惠普企业(HPE)协助英伟达构建两台新一代超级计算机“Mission”和“Vision”,分别用于国家安全和开放科研任务。

Vera Rubin 的亮相颇具战略意味。英伟达的老对手 AMD 刚刚赢得美国能源部的 10 亿美元超算合同,在高性能计算市场中给英伟达带来了不小的压力。

从架构层面看,Vera Rubin 是英伟达迄今最复杂的计算平台,由 Vera CPU 和 Rubin GPU 组成,分为普通版 Vera Rubin NVL144 和 Ultra 版 NVL576。

Vera Rubin NVL144 平台将采用两颗全新芯片。Rubin GPU 将采用两颗 Reticle 大小的芯片,FP4 性能高达 50 PFLOP,并配备 288 GB 的下一代 HBM4 显存。此外,NVL144 平台还将搭载一颗 88 核 Vera CPU,该 CPU 采用定制的 ARM 架构,拥有 176 个线程,以及高达 1.8 TB/s 的 NVlink-C2C 互连。


(资料图)

性能扩展方面,NVL144 平台将具有 3.6 Exaflops 的 FP4 推理算力和 1.2 Exaflops 的 FP8 训练算力,比 GB300 NVL72 提升 3.3 倍,13 TB/s 的 HBM4 内存和 75 TB 的快速内存,比 GB300 提升 60%,并且 NVlink 和 CX9 功能的额定速度分别达到了 260 TB/s 和 28.8 TB/s。

NVL144 主要面向 AI 模型的极大规模训练与实时推理,预计将在 2026 下半年问世。更高端的 NVL576 平台预计将在 2027 年推出,其 FP4 推理性能将达到 15 Exaflops 级别,FP8 训练性能达 5 Exaflops。


(资料图)

黄仁勋表示,Rubin 平台“并非单纯为AI 设计,而是兼顾了科研与 AI 的双重任务”。因此,它并未为低精度AI 性能牺牲传统高性能计算能力,依旧支持高精度 FP64 科学计算,确保物理模拟、气候模型、量子化学等科研任务能够获得充分性能。

洛斯阿拉莫斯实验室的Vision 系统将率先部署 Vera Rubin 架构,用于开放科学研究与 AI 模型开发;Mission 系统则面向国家核安全任务,计划在 2027 年正式上线。按计划,Vision 的性能将至少比其前代系统 Venado(约 98.5 PFLOPS FP64)提升一倍以上。

英伟达指出,AI 模型规模的迅速增长,正在迫使计算平台在内存带宽、互连速率与能效比上取得平衡。


图 | 英伟达路线图(英伟达)

Rubin 平台支持 NVlink Gen6 与 CX9 网络,可在节点间提供 260 TB/s 与 28.8 TB/s 的总带宽,使数千 GPU 能以接近单机的延迟进行协同计算。这一特性对训练超大规模多模态模型尤为关键。

不过,英伟达尚未公布完整的Vera Rubin 系统功耗、散热方案与软件栈兼容细节,尤其是在与 CUDA、HPC SDK、OpenACC 以及科学模拟软件的适配层面。Vera CPU 的微架构信息同样有限,外界推测其或基于 Grace 的进化版本,但尚未确认。

会上,英伟达还推出一种名为NVQlink 的互连技术,黄仁勋将其称为是“连接量子和经典超级计算机的罗塞塔石碑”,它将量子和传统超级计算机整合成了一个统一、连贯的系统,标志着量子 GPU 计算时代的到来。


(资料图)

NVQlink 将量子处理器和控制硬件系统的多种方法直接连接到 AI 超级计算机上,能够帮助量子从业人员克服在扩展硬件时所面临的集成难题。作为一种开放系统架构,它可以将 GPU 计算与量子处理器进行紧密结合,从而为量子超级计算机带来加速。

据了解,量子比特是一种让量子计算机能以普通计算机无法做到的方式处理信息的信息单位,它不仅非常精密而且容易出错,因此需要使用复杂的校准技术、量子误差校正技术和控制算法才能正常运行。此前,这种算法必须依托传统超级计算机极其苛刻的低延迟和高吞吐量进行连接,只有在这时才能控制量子比特误差,从而实现相关的量子应用。

而 NVQlink 则提供了上述过程所需要的互连能力,为打造一些跨行业的应用提供了所需的环境。黄仁勋公开表示,在不久的将来,每台基于英伟达 GPU 的科研型超级计算机都将拥有混合型的特点,并能与量子处理器紧密结合,从而能够扩展计算的可能性,最终为未来打造混合量子·经典超级计算机做好准备。

目前,用户可以通过与英伟达CUDA-Q 软件平台的集成来访问 NVQlink,从而实现 CPU 和 GPU 的无缝利用,以及创建关于量子处理器的应用程序。

眼下,NVQlink 已经为 17 个量子行业机构、5 个控制器行业机构、9 家实验室实现了量子和 GPU 计算的互连。英伟达称这一技术还能让量子处理器连接到一些超级计算实验室的设备上,目前 NVQlink 已经被用于美国布鲁克海文国家实验室等实验室,正在帮助量子从业人员实现大规模量子计算和量子纠错所需的控制算法,助力构建混合型量子经典系统,加速实现化学领域和材料领域的下一代应用。

参考资料:

https://nvidianews.nvidia.com/news/nvidia-nvqlink-quantum-gpu-computing

https://gizmodo.com/nvidia-supercomputers-for-trump-2000678264

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。