当前位置: 首页 » 资讯 » 新科技 » 正文

在英伟达的这场发布会上,游戏佬只占了2分钟。。。

IP属地 中国·北京 差评XPIN 时间:2026-03-18 00:30:24


就在昨天凌晨 2 点,英伟达召开了一年一度的 GTC ( GPU 技术大会)。

与市面上厮杀激烈的各家大模型不同,老黄根本不担心自家的显卡没人用,所以这次的大会还是那么硬核,没有太多的弯弯绕绕,只有肌肉感爆棚的性能数据。

而作为将英伟达市值推向世界第一的推手,AI 仍然是这次大会的核心。

还是两个小时拉满的时长,还是那个皮衣老黄。不过么,他已经彻底不是什么刀客了。

看完整场演讲,发现世超还是低估了英伟达的野心,老黄不止想当卖显卡的算力军火商,他还想整合出一个贯穿 AI 行业的基建——“ AI 工厂 ”。


首先,伴随着一阵强劲的音乐,老黄闪亮登场:Welcome to GTC!

虽然这次主题还是 AI,但是开头的第一个新产品居然是游戏相关的 DLSS 5。

其实也能理解,当初是 GeForce 游戏显卡一刀一刀将 AI 带给世界的,怎么着也该轮到 AI 来反哺一下游戏了。


作为之前 DLSS 4.5 的升级版,DLSS 5 引入了“实时神经渲染”,直接把 AI 接入渲染流程中,根据渲染时的运动和矢量信息,实时地给场景注入更接近真实世界的光照和材质表现。


简单点说,之前是根据画面,来生成帧插入进去,现在是直接加入渲染流程,成为渲染的一部分。

得到的效果就是让游戏视觉逼近了电影级的真实感,同时还能保持较高的帧率运行。


效果这么好,算力需求也是蹭蹭涨, DLSS 5 的秋季首发只在 50 系显卡上,不少玩家估计还得等后续的适配和优化才能体验到。

除了算力门槛,网友们对这个 AI 效果的强度其实也有点担忧,就比如下面的演示图,开启与关闭后效果差别非常大,除了细节,连风格都会受到很大影响。

所以英伟达也在博客中提到,效果的最终呈现会交给游戏开发者进行打磨,防止破坏掉原来的美术风格。


而在整整“2 分钟”的介绍落幕后,游戏玩家们就能关掉屏幕了,接下来是 AI 的主场。

老黄打造“AI 工厂”,蓝图规模相当宏大,从底层的算力芯片,到中间的大模型,乃至末端的 AI 应用,都有新产品,几乎是全产业链的覆盖。

首先当然是 CES 刚刚亮相的 Vera Rubin 新平台,作为继 Blackwell 后的新一代架构,这是未来几年英伟达 AI 算力的核心王牌。

而在这张王牌打出来前,老黄可以说是煞费苦心,铺垫了半天的“AI 工厂”建设。

先是说 Token 是新时代工业产物;接着忆往昔从 Geforce 到 CUDA,RTX 的荣耀过往;然后商务一波夸了夸 Claude Code、Codex 这类智能体工具,以及它们带来的巨量 Token 需求;最后才顺理成章的掏出了“Vera Rubin”这套 AI 工厂的标准生产设备。

不过看数据,Rubin 还是相当能打的,在主力 Vera Rubin NVL72 机柜中,单机架能塞进 72 颗 Rubin GPU + 36 颗 Vera CPU,训练 MoE 模型只需上一代 Blackwell 的 1/4 GPU 算力,效率飞升,而且已经量产,预计是下半年出货。


但话说回来,老黄也不是白铺垫的,除了 Rubin,他更想卖的其实是整合了算力产业的捆绑包,里面除了 GPU,还有英伟达自家的 CPU,用于信号传输的 NVlink 72,以及液冷机架,存储系统,网络系统,安全管控,机架级集成等配套设施。

他甚至怕你买了不会使,特地致敬了一波隔壁的 meta,用“Omniverse”这个数字孪生技术搞了个虚拟 AI 工厂,让你先把设备,网络,运营等等全部跑通,再进入现实建设。他真的,我哭死。。。


当然,除此之外,其实最值得关注的就是推理效率极高的“LPU”(Language Processing Unit)了。

LPU是语言处理器,是专门针对AI模型推理设计的算力芯片,原本是初创公司 Groq 研发的,跟 GPU 走了不同的路子,一度威胁到了英伟达的护城河。

也正因如此,英伟达去年豪掷200亿美元买到了Groq 的核心资产,开始自己研发了。


这次老黄也没藏着,直接宣布已经把 LPU 集成到了 Vera Rubin 平台,推出了 NVIDIA Groq 3 LPX 作为推理加速器。

NVIDIA Groq 3 LPX Rack 的单机架能塞 256 颗 Groq 3 LPU,总规格炸裂,AI 推理算力能达到 315 PFLOPS,而且最为恐怖的是内存带宽,足足 40 PB/s,是这次 Rubin GPU 机柜的 25 倍,推理速度直接起飞。

这下,短板补足补成了长板。Groq 3 专攻超低延迟的推理,Rubin GPU 主打量大管饱的训练,正好拼凑出英伟达从训练到推理的生态闭环。


硬件的肌肉秀完了,显然老黄还不满足,AI 相关的应用和模型继续一个一个的往外掏。

其中就有差友们最近耳熟能详的“龙虾”产品,没错,老黄也在搞龙虾。不过是更高规格的企业级代理平台,叫做“NemoClaw”。


它被称作是 Linux 一样的“新操作系统”,内置安全层,支持自主进化和全天候运行,并用 NVIDIA Agent Toolkit 加固了安全性。

老黄说这是 Token 商品化的软件基础,推理市场万亿级需求就靠它驱动了。要世超说,还真是,要不这些天的 API 账单怎么这么长呢。。。

除了龙虾,英伟达还发布了 Agent 配套的软件设施。


比如开源分布式推理平台 Dynamo 1.0(AI 工厂分布式“操作系统”),用于统一管理 GPU/内存资源,提升 Agent 的推理效率。

接着推出了 120B 参数的混合 MoE 模型 Nemotron 3 Super ,说是 OpenClaw 的最佳开源模型,支持百万上下文和多 Agent 协作。

这次英伟达也是赶上龙虾的热度了。


当然,在此之外,老口号也是得强调的。随着老黄高声宣告“物理 AI 时代已来”,大伙儿的视角又被拉向了未来。

这次的核心产品是具身智能模型“Isaac GR00T N 系列”以及世界模型“Cosmos”。

具身智能的模型好理解,其实就是机器人的大脑。

现在的机器人,虽然看起来很灵活,但大多是提前录制的动作模组,做不到和人一样能够实时反馈。

而训练一个好用的具身智能模型可能比大语言模型还要难。


就比如宇树科技 CEO 王兴兴也在这次 GTC 发表了演讲,介绍了一下最近在具身智能方面的进展。

他表示看好在未来 2-3 年内跨过具身智能的“ChatGPT”时刻,但现在最大的瓶颈是还没有出现一个真正具备强泛化能力,在陌生场景中稳定执行任务的具身智能模型。

也就是缺一个能够灵活指挥的机器人大脑。

语言模型训练有现成的大规模数据集,但具身智能模型需要的数据是跟世界的真实交互,这些交互数据非常难采集,现有的数量还远远不够。


所以说实话,英伟达这次的 GR00T N1.7 模型算是阶段性常规发布,至于预告里更好用的 GR00T N2 预览版,虽然目前在 MolmoSpaces 和 RoboArena 基准上排名第一,但要在 2026 年底才会发布。

更有看头的是反而是后面这个世界模型“Cosmos”。


它能够以高度真实的物理模拟合成虚拟的现实世界,用于训练机器人进行时空感知。

再加上自家的软硬件组合,大规模塑造真实+模拟的数据会更加容易,这有可能是解决现实世界交互数据采集困难的一条出路。

咱也期待一手,毕竟真的物理 AI 实现了,那工作起来效率就更高了(摸起鱼来就更爽了)。


总的来说,老黄还在带领英伟达朝着他理想中的 AI 时代大步迈进,而他背后这些密密麻麻的机构名称也提醒着我们,AI 时代的下一幕可能不远了。

而在下一幕的舞台上,除了在竞技场角力的巨头们,你我的衣食住行可能都会被搬到台前。

撰文:风华

编辑:江江 & 面线

美编:素描

图片、资料来源

NVIDIA官网,机器人前瞻


免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。