
英伟达最新Vera CPU
北京时间3月14日,据CNBC报道,多年来,英伟达的图形处理器(GPU)一直是市面上最热门的芯片,但AI智能体的突然兴起,为其更为低调的主机芯片中央处理器(CPU)带来了复兴。
现在,英伟达准备在周一开幕的年度GTC大会上,公布其针对AI智能体优化的CPU的新细节,届时很可能在展台上推出一款纯CPU机架。
“CPU正成为扩展AI和智能体工作流的瓶颈。”英伟达AI基础设施主管迪昂哈里斯(Dion Harris)本周对CNBC表示。他认为,这是一个“令人兴奋的机会”。
英伟达在2021年发布了其首款数据中心CPU Grace,下一代产品Vera现已投入生产。这些CPU通常与英伟达著名的Hopper、Blackwell或Rubin GPU一起部署在完整的机架级系统中。
GPU需求的激增使英伟达成为家喻户晓的企业,并成为全球市值最高的上市公司,市值达到4.4万亿美元。今年2月,英伟达整体芯片战略发生了重大转变。当时,英伟达与meta达成了一项多年协议,其中包括首次大规模独立部署Grace CPU,并计划在2027年部署Vera。
英伟达告诉CNBC,数千个独立的英伟达CPU也在为得克萨斯高级计算中心和洛斯阿拉莫斯国家实验室的超级计算机提供动力。
智能体带动CPU复兴
美国银行预测,CPU市场规模可能会增长一倍以上,从2025年的270亿美元增至2030年的600亿美元。仅在上个季度,英伟达就创造了超过620亿美元的数据中心收入,同比增长75%。
CPU的复兴源于计算需求的根本变化:随着AI大规模普及,应用场景从问答型聊天机器人逐渐转向以任务为导向的智能体应用。
虽然GPU非常适合训练和运行AI模型,因为它们拥有成千上万颗专注于同时执行大量运算的小核心,但CPU拥有数量较少的高性能核心,可以运行连续的通用任务。
AI智能体需要大量通用计算能力,因为它们需要在AI工作流中传输和处理大量数据,并在多个智能体之间进行协同和调度。

黄仁勋
英伟达CEO黄仁勋(Jensen Huang)在上个月的财报电话会议上表示:“这些智能体系统正在衍生出不同的智能体,它们像一个团队一样协同工作。tokens生成的数量已经呈现指数级增长,因此我们需要以更高的速度进行推理。”
黄仁勋在电话会议上多次提到AI智能体,并表示:“在硬件需求转变的情况下,最重要的就是每瓦性能。”
英伟达在一份新闻稿中表示,其独立CPU在meta的数据中心显著提升了每瓦性能。Creative Strategies芯片分析师本巴亚林(Ben Bajarin)表示:“这是全新的基础设施:纯CPU机架的全新扩容只负责运行AI智能体。你的软件将位于别处,你的加速器只负责处理tokens,但必须有中间层来负责协调调度。”
CPU供应危机
如今,一度沉寂的CPU市场正面临咨询公司The Futurum Group所称的“静悄悄的供应危机”。该机构预测,到2028年,CPU市场的增长率可能会超过GPU。
据路透社报道,头部CPU供应商AMD和英特尔已向中国客户发出供应短缺警告。报道称,CPU交付周期长达六个月,价格已上涨超过10%。
“过去六到九个月,需求出现了前所未有的增长。”AMD数据中心主管福雷斯特诺罗德(Forrest Norrod)在接受CNBC采访时表示。
诺罗德认为,CPU需求在短期内不会放缓,也不会停止增长,但AMD已经预见到了需求的增长,并正在“加紧努力”以满足需求。
英特尔发言人告诉CNBC,该公司预计本季度库存将达到“最低点”,“但我们正在积极应对,并预计从第二季度到2026年年底,供应将逐步改善”。
Creative Strategies芯片分析师巴亚林表示:“晶圆不会自己长出来。我们没法凭空多收获10%的硅晶圆。整个行业都面临供应紧张的局面。所以不幸的是,CPU晶圆供应受到了限制。”
当被问及英伟达是否会遭遇CPU发货延迟时,英伟达AI基础设施主管哈里斯告诉CNBC,“目前一切正常”。
他表示,英伟达拥有“稳健的供应链”,能够应对需求压力,这在很大程度上得益于该公司将许多CPU与GPU一起在机架级系统中销售。
为GPU优化
哈里斯表示,与英特尔和AMD生产的更为通用型CPU相比,英伟达在设计上采取了根本不同的方法,使其CPU“最适合”数据处理和AI智能体工作流程。
其中一个主要区别在于每个CPU的核心数量。AMD的EPYC系列和英特尔至强高性能服务器CPU通常拥有128个核心,而英伟达Grace CPU拥有72个核心。

AMD EPYC系列服务器CPU
哈里斯解释说:“如果你是超大规模云计算企业,你会希望最大化每个CPU的核心数量,这本质上是为了降低成本,即每核心成本。所以这是一种商业模式。”
但是,英伟达设计其CPU的初衷是专门辅助其明星产品GPU运行AI工作负载。“在这种情况下,你的单线程性能比每核心成本更为重要,因为你要确保那个极为昂贵的资源GPU不会空闲等待。”哈里斯说。
英伟达的CPU也基于ARM架构,该架构更常用于智能手机等低功耗设备的芯片,而英特尔和AMD的CPU则基于传统的x86架构。x86由英特尔在近50年前推出,自诞生以来一直主导PC和服务器处理器设计。
AMD数据中心主管诺罗德表示:“我认为,英伟达已经非常好地优化了他们的芯片,用于为GPU提供算力支持,但它们并没有针对通用应用进行很好的优化。”
实际上,英伟达在某些产品上确实依赖于更通用的CPU。例如,在HGX Rubin NVL8平台中,英伟达将自家GPU与英特尔或AMD的主机CPU配对,供客户用作构建自有AI机架的基础组件。
英伟达进军独立CPU市场之际,其越来越多的客户正在为自家数据中心研发基于ARM架构的处理器。
亚马逊是首家推出自研CPU的主要超大规模云服务公司,于2018年发布了Graviton处理器。The Futurum Group称,谷歌在2024年发布的Axion处理器,如今处理着约30%的内部应用。微软在去年11月发布了其第二代Cobalt处理器。ARM预计将于今年推出其自研CPU,meta将成为其早期客户。
研究公司Mercury Research估计,2025年第四季度,服务器CPU市场份额由英特尔主导,占比60%,AMD占24.3%,英伟达占6.2%,其余份额则由亚马逊、微软和谷歌等超大规模云计算企业基于ARM架构的自研CPU占据。(作者/箫雨)
更多一手新闻,欢迎下载凤凰新闻客户端订阅科技。想看深度报道,请微信搜索“科技”。





京公网安备 11011402013531号