在刚结束的 GTC26 期间,英伟达(NVIDIA)CEO 黄仁勋通过一场深度访谈与财务问答,向外界展示了这家市值巅峰企业的宏大蓝图。从“1万亿美元订单可见性”到“智能体(Agent)就是未来的个人电脑”,老黄不仅在卖芯片,更在重塑全球IT产业的分配逻辑。
华尔街见闻整理金句如下:
关于 Token 与价值:如果你的一名年薪50万美元的工程师,一年只花5000美元买Token,我会发疯的。如果那名50万美元的工程师没有消耗至少价值25万美元的 Token,我会深感不安。即使芯片是免费的,如果它不能跟上技术状态和我们运行的速度,它也依然不够便宜。
关于智能体与未来:每个工程师都将拥有100个智能体。在过去我们编写代码,在未来我们将编写想法、架构和规范。智能体系统是完成工作的系统,它们正在帮助我们的软件工程师完成工作。
关于Token经济学:计算机过去只是工具,未来的计算机是制造设备。人们购买这些计算机是为了生产Token,生产这些Token的有效性至关重要。你同时购买了最昂贵的计算机,并生产了成本最低的 Token。
关于市场需求与增长:我们对Blackwell加Reuben的需求、订单和需求有超过1万亿美元的强劲可见性。我们的增长率实际上正在加速。每一个软件公司、每一个公司都需要有一个OpenClaw策略。
关于竞争与架构:任何说‘我的芯片便宜 30%’的人,只是证明了他们不懂 AI。你只要呼吸空气,直到呼吸完为止。在那之后,我们将呼吸压缩液态空气,但在此之前,空气怎么样?它是免费的,我们已经用了很久了。”(注:此处指代对铜缆/电缆技术的使用极限)
财务核弹:1万亿美元的订单墙
黄仁勋在分析师会议上抛出了一个震撼数字:英伟达对 Blackwell 和 Reuben 架构的订单需求可见性已超过 1 万亿美元。
增长背后的逻辑:这一数字并非虚标,而是基于确定的采购订单和工厂建设流水线。老黄强调,英伟达的优势在于其交付周期远快于自研 ASIC 芯片的公司,甚至能实现“同季度下单、同季度出货”。
毛利护城河:面对“价值被英伟达抽走”的质疑,老黄直言:“TSMC 的晶圆全球最贵,但价值最高,所以我乐意付钱。”他认为,客户买的不是昂贵的电脑,而是全球成本最低的 Token 生产力第三次拐点:从大模型到“智能体”
黄仁勋认为,AI 已经历了生成式、推理两个阶段,现在正处于第三个拐点——智能体系统(Agentic Systems)。
Token 成为新工资:未来企业雇佣工程师,发的不只是笔记本电脑,还有Token 预算。如果一个年薪 30 万美元的工程师不消耗 Token,那他就是在荒废生产力。
个人 AI 电脑的诞生:以开源项目 OpenClaw 为代表的系统,被老黄定义为“人类历史上第一台个人人工智能计算机”。它拥有内存、调度、技能和 API,是未来 IT 产业的操作系统。
硬件新版图:Vera Rubin 与 Groq 的“联姻”
英伟达不再只是一家 GPU 公司,而是一家“AI 工厂”公司。
解耦推理(Disaggregated Inference):这是 Dynamo 操作系统的核心。通过将推理任务拆解,不同性能的芯片各司其职。
Groq 的角色:英伟达收购并整合 Groq(LPX 系列)并非为了取代 GPU,而是利用其极低延迟的 SRAM 架构处理自回归推理的“最后一步”。
三位一体架构:英伟达是全球唯一能同时优化HBM(高带宽显存)、LPDDR5 和 SRAM的公司,这种“液冷机架化”的整机交付,让竞争对手的单点芯片显得像个“缝合怪”。
物理 AI:50万亿美元的蓝海
老黄特别看好物理 AI(Physical AI),认为其最终规模将超过数字 AI。
重塑传统工业:这是一个产值 50 万亿美元、过去 20 年几乎是科技荒漠的领域。从机器人手术、自动驾驶到智能基站,物理 AI 需要在边缘侧遵守物理定律。
3-5年内的机器人爆发:黄仁勋预言,未来 3 到 5 年机器人将随处可见。虽然中国在电机、稀土等硬件供应链上极具优势,但英伟达将提供大脑(训练、仿真、车载三台计算机)。
行业共生:英伟达是云服务商的“最佳销售”
针对云巨头自研芯片的威胁,老黄表现得极其自信:
流量带货:“AWS、谷歌、微软在 GTC 展位最大,是因为他们要向我的 CUDA 开发者推销服务。”英伟达通过 CUDA 生态将开发者引向云端,本质上是云服务商的获客引擎。
不可替代性:40% 的业务来自于非云巨头领域(区域云、企业私有云),这些客户买的是“全栈平台”而非“芯片”。如果没有英伟达的整机方案,这些市场根本无法触达。
以下为两场访谈的全文,由AI辅助翻译:
《All-In Podcast》访谈主持人 (Jason Calacanis):
本周是特别节目,我们破例推迟了常规节目。通常我们只为三个人破例:特朗普总统、耶稣和黄仁勋。你可以自己排个序。Jensen,你这一年的表现太惊人了,这次活动也非常棒,每个行业、每家科技公司、每家 AI 公司都在这里。
主持人 (Chamath Palihapitiya):
去年最重大的宣布之一就是英伟达收购了 Groq。当你决定买下 Groq 时,你有没有意识到 Chamath 会变得多么难以忍受?
黄仁勋 (Jensen Huang):
我有这种预感(笑)。我们是他的朋友,每周都要应付他,我知道在结案的那六周里你得怎么对付他。
黄仁勋 (Jensen Huang):
实际上,我们的许多战略早在 GTC(英伟达 GPU 技术大会)上就已经公开展示了。两年半前,我介绍了 AI 工厂的操作系统,叫做Dynamo。正如你们所知,Dynamo 是西门子发明的,目的是把水能转化为电能,它驱动了上一次工业革命。我觉得这是下一次工业革命“工厂操作系统”的完美名字。
在 Dynamo 内部,核心技术是解耦推理(Disaggregated Inference)。Jason,我知道你技术很强,我让你来向观众解释一下。
主持人 (Jason Calacanis):
谢谢你没直接抢过话头。解耦推理意味着推理的处理流水线极其复杂,它是当今最复杂的计算问题。规模庞大,涉及各种形状和大小的数学运算。我们的想法是把处理过程拆解开,让一部分在某些 GPU 上运行,其余部分在不同的 GPU 上运行。这让我们意识到,甚至解耦计算也是有意义的。
这种思路引导我们收购了 Mellanox。如今,英伟达的计算分布在 GPU、CPU、交换机和网络处理器中。现在我们加入了 Groq,我们将把合适的工作负载放在合适的芯片上。我们已经从一家 GPU 公司演变成了一家 AI 工厂公司。
主持人 (Chamath Palihapitiya):
你在台上提到,高价值推理用户应该关注这一点。你说数据中心 25% 的空间应该分配给这种 Groq LPU 和 GPU 的组合。你能告诉我们,行业如何看待这种“预填充-解码解耦”的新型计算形式吗?
黄仁勋 (Jensen Huang):
退一步看,当我们加入这项技术时,我们正从“大语言模型处理”转向“智能体处理(Agentic Processing)”。当你运行一个智能体时,你会访问工作内存、长期内存、使用工具,并对存储产生巨大的压力。智能体之间还会相互协作。
因此,数据中心内存在各种类型的模型。我们创建了 Vera Rubin 架构来处理这些极其多样化的负载。英伟达的潜在市场规模(TAM)因此增加了 33% 到 50%。其中很大一部分将是存储处理器(BlueField)、Groq 处理器、CPU 和网络处理器。这些共同构成了 AI 革命的电脑,也就是“智能体”。
主持人 (David Friedberg):
那嵌入式应用呢?比如我女儿在家里的泰迪熊想要和她聊天。里面装的是定制芯片,还是会有一套更广泛的、针对边缘侧开发的工具?
黄仁勋 (Jensen Huang):
在大规模层面上,我们认为这个问题涉及三台计算机:
第一台用于训练 AI 模型。
第二台用于评估。比如机器人和自动驾驶汽车,必须在符合物理定律的虚拟实验室(Omniverse)中进行评估。
第三台是边缘侧的机器人计算机。它可能是一辆车、一个机器人,或者是一只小泰迪熊。
我们还在做一件非常重要的事:将电信基站转化为 AI 基础设施的一部分。这是一个 2 万亿美元的产业,未来无线电基站、工厂、仓库都将成为 AI 的延伸。
主持人 (Brad Gerstner):
Jensen,去年你领先全球预言“推理不会只增长 1000 倍”。现在它是要增长 100 万倍还是 10 亿倍?当时人们觉得你太夸张了,因为大家都在关注训练。但现在推理需求爆炸了。
有人说你的推理工厂成本高达 400-500 亿美元,而定制芯片(ASIC)方案只要 250-300 亿,你会因此失去市场份额。你对此怎么看?为什么大家要付双倍的溢价?
黄仁勋 (Jensen Huang):
核心逻辑是:你不应该把“工厂的价格”等同于“Token 的成本”。我可以证明,一座 500 亿美元的工厂能为你产生成本最低的 Token。
因为我们的效率高出 10 倍。在 500 亿的预算中,有 200 亿是土地、电力和厂房,无论用什么芯片这些钱都要花。剩下的差额在整体成本中占比并不大。但如果我的数据中心吞吐量是别人的 10 倍,那么即便别人的芯片是免费的,他们也拼不过我们。
主持人 (Chamath Palihapitiya):
你管理着全球市值最高的公司,明年营收可能超过 3500 亿美元。你是如何决定“该做什么”的?你如何获得直觉,知道在哪里加倍下注,在哪里撤退?
黄仁勋 (Jensen Huang):
这就是 CEO 的工作:定义愿景和战略。我会被公司里优秀的科学家和技术专家启发,但我必须塑造未来。
我的标准是:这件事是不是难到令人发指?如果很容易,我们就应该退缩,因为容易的事竞争对手会很多。我寻找的是那些从未被实现过、极其困难、且能发挥英伟达“超能力”的事。我们知道这会带来痛苦和磨难,但如果没有痛苦,也就没有伟大的发明。
主持人 (Brad Gerstner):
你能谈谈几个长线业务吗?比如空间数据中心、自动驾驶或是数字生物学?
黄仁勋 (Jensen Huang):
物理 AI是一个巨大的类别。这是一个产值 50 万亿美元的产业,直到现在几乎还是科技的荒漠。我们 10 年前就开始布局,现在它正处于爆发点,每年为我们带来近 100 亿美元的收入。
数字生物学正在迎来它的“ChatGPT 时刻”。我们正开始理解如何表示基因、蛋白质和细胞。在未来 5 年内,医疗行业将发生巨变。农业也是如此。
主持人 (Jason Calacanis):
英伟达最初是靠游戏玩家和发烧友起家的。你提到了“智能体”的革命,特别是开源智能体在桌面端的应用。这对于你来说意味着什么?
黄仁勋 (Jensen Huang):
过去两年有三个转折点:
生成式 AI:ChatGPT 让所有人意识到了 AI 的存在。
推理(Reasoning):像 O1 这样的模型让 AI 不仅能回答问题,还能进行推理。
智能体(Agents):最初是像 Claude Code 这样的企业工具,而OpenClaw将 AI 智能体带入了大众视野。
OpenClaw 之所以重要,是因为它重新定义了计算模型。它有内存、文件系统、技能(Skills)、资源调度和 API。这本质上就是人类历史上第一台个人人工智能计算机。它是开源的,可以在任何地方运行。
主持人 (Brad Gerstner):
这种范式转移是否让现在的 AI 监管立法变得毫无意义?政治家们该如何应对这种快速变化?
黄仁勋 (Jensen Huang):
我们需要站在决策者面前,告知他们技术的真相:它不是生物,不是外星人,没有意识,它只是计算机软件。
我们不能让“末日论”影响政策。作为国家,最大的安全风险不是 AI 本身,而是当我们因为恐惧而停滞不前时,其他国家却在采用这项技术。我担心的是 AI 在美国的普及速度。
主持人 (Brad Gerstner):
关于 Anthropic 之前与国防部的风波,如果你是董事会成员,你会给他们什么建议来改变公众的恐惧感?
黄仁勋 (Jensen Huang):
Anthropic 的技术非常出色,我们也是他们的大客户。警示技术的潜力是好事,但“警示”不等于“恐吓”。
我们作为技术领袖,说话必须更加谨慎和谦虚。在没有任何证据的情况下散布“毁灭性”的言论,其伤害比人们想象的要大。现在技术对社会结构和国家安全如此重要,我们的言辞至关重要。
主持人 (Brad Gerstner):
美国公众对 AI 的支持率只有 17%。我们曾因为恐惧毁掉了核能产业,现在中国在建 100 座核反应堆,我们是零。
回到智能体,英伟达内部的生产力提升如何?大家都在讨论投资回报率(ROI)。你认为我们会看到营收像智能一样呈指数级增长吗?
黄仁勋 (Jensen Huang):
看这个会场的观众就知道了,99% 的东西都是 AI。 从生成式到推理,计算量增加了 100 倍;从推理到智能体,计算量又增加了 100 倍。两年内计算量翻了 1 万倍。
人们会为“信息”付费,但更愿意为“工作”付费。聊天机器人很好,但能帮我完成工作的智能体才真正值钱。智能体正在帮我们的工程师完成工作。我们现在还没到真正的大规模阶段,未来的增长将是百万倍级的。
主持人 (Jason Calacanis):
英伟达有 4.3 万名员工,其中 3.8 万是工程师。如果你的一名年薪 50 万美元的工程师,一年只花 5000 美元买 Token,你会怎么想?
黄仁勋 (Jensen Huang):
我会发疯的!如果一个 50 万美元年薪的工程师一年不消耗至少 25 万美元的 Token,我会非常担心。
这就像一个芯片设计师说他只要纸和笔,不需要 CAD 工具一样。这是一种范式转移,就像勒布朗·詹姆斯每年花 100 万美元保养身体一样。我们要给知识工作者“超能力”。
主持人 (Jason Calacanis):
未来两三年,这种“全明星”员工的工作效率会变成什么样?
黄仁勋 (Jensen Huang):
那些“这太难了”、“这需要太长时间”的想法将不复存在。就像工业革命后,没人会说“那个建筑太重了”一样。重力和规模不再是问题,剩下的只有创造力。
过去我们编写代码,未来我们编写“想法”、架构和规范。每个工程师未来都将管理 100 个智能体。
主持人 (David Friedberg):
我上周日晚上花了 90 分钟用智能体替换了一整套软件架构,原本这需要很多人手。这种加速感是前所未有的。
黄仁勋 (Jensen Huang):
这就是为什么 OpenClaw 如此不可思议。一些人认为企业软件行业会被摧毁,但我的观点相反:这个行业过去受限于“办公位上的员工人数”。未来将有 100 倍数量的智能体去敲击 SQL 数据库、Photoshop 和 Blender。这些工具是人类控制结果的最后途径。
主持人 (Chamath Palihapitiya):
关于开源,中国的一些开源模型非常强大。你认为 AI 的终局是去中心化的吗?
黄仁勋 (Jensen Huang):
我们需要“模型即产品(私有)”和“模型即开源”并存。 对于大多数消费者,我不想自己微调模型,我会用 ChatGPT 或 Claude。但对于垂直行业,他们需要控制自己的领域知识,这必须依靠开源模型。英伟达也在大力支持开源生态,因为这能让初创公司在第一天就拥有世界级的垂直能力。
主持人 (Brad Gerstner):
特朗普总统希望美国工业领先,希望美国 AI 走向世界。目前英伟达在某些市场(如中国)的市场份额从 95% 跌到了 0%。现在情况如何?
黄仁勋 (Jensen Huang):
特朗普总统希望我们重返战场。我们已经为许多请求采购的中国公司申请了许可证,并得到了批准。我们正在重启供应链进行发货。
如果美国不能主导 AI 技术的堆栈(从芯片到系统),那是国家安全的重大损失。我希望美国的计算堆栈占据全球 90% 的份额。
主持人 (Jason Calacanis):
全球冲突、台湾局势、甚至中东的氦气供应,这些供应链风险让你担心吗?
黄仁勋 (Jensen Huang):
在中东,我们有 6000 个家庭在那里,我们 100% 支持他们,100% 留在以色列。 关于台湾,我们要做的有三点:
尽可能快地实现美国本土工业化(如亚利桑那州的工厂)。
实现供应链多元化(韩国、日本、欧洲)。
保持耐心和克制。
主持人 (Jason Calacanis):
自动驾驶方面,你的策略是像 Android 那样的开源平台,而特斯拉更像 iOS。你如何看待这个棋局?
黄仁勋 (Jensen Huang):
我们的目标是让世界上每一家汽车公司都能制造自动驾驶汽车。我们提供三台计算机(训练、仿真、车载),并开发了最安全的操作系统。即便像马斯克和特斯拉这样拥有强大自研能力的客户,也会买我们的训练计算机。我们乐于提供任何层面的解决方案,我们不是来取代谁,而是来解决问题的。
主持人 (Brad Gerstner):
但像谷歌、亚马逊这些大客户也在自研芯片(TPU、Trainium)。他们既是客户也是竞争对手,你如何应对?
黄仁勋 (Jensen Huang):
我们是世界上唯一一家与每一家 AI 公司都合作的 AI 公司。我不看他们研发什么,但我向他们展示我研发的一切。
信心来自于两点:
购买英伟达的产品仍然是目前最经济的选择。
我们是唯一的跨平台架构(云端、本地、车载、甚至空间)。
很多人没意识到,英伟达 40% 的业务来自于构建完整的 AI 基础设施,而不只是卖芯片。事实上,英伟达的市场份额正在增加,因为 Anthropic、meta 都在用英伟达,开源模型的爆发也在英伟达之上。
主持人 (Brad Gerstner):
分析师们似乎不相信你的增长潜力。他们预测你明年增长 30%,后年 20%,2029 年只有 7%。他们觉得“大数法则”会限制你。
黄仁勋 (Jensen Huang):
他们只是不理解 AI 的规模和广度。过去数据中心的 CPU 市场一年只有 250 亿美元,而我们现在的体量已经完全不同了。英伟达做的不是芯片,而是 AI 基础设施,这个市场比人们想象的要大得多。
主持人 (Chamath Palihapitiya):
谈谈空间数据中心?
黄仁勋 (Jensen Huang):
我们已经在太空中了。挑战在于散热(只能靠辐射),但这并非不可解决。目前我们的芯片已经安装在卫星上处理影像。与其把数据传回地球,不如直接在太空处理。
主持人 (Jason Calacanis):
在医疗领域,AI 将如何产生真正的影响?
黄仁勋 (Jensen Huang):
三个方向:
AI 生物学:预测生物行为,助力药物研发。
AI 智能体:辅助医生诊断。
物理 AI/机器人手术:未来的超声、CT 仪器都会内置智能体。
主持人 (Jason Calacanis):
机器人技术经历了“失去的二十年”,现在马斯克的 Optimus 还有中国的机器人发展很快。我们离“机器人厨师”或“机器人管家”还有多远?
黄仁勋 (Jensen Huang):
大约 3 到 5 年。中国在电机、稀土、磁铁等硬件生态上非常强大,全球机器人产业都将依赖那个供应链。 最终,机器人将成为人类繁荣的最大推动力。它不仅能解决劳动力短缺,还能让每个人通过机器人开启自己的事业。甚至我们可以通过虚拟现实“附身”在机器狗身上,在出差时陪孩子聊天或遛狗。
主持人 (Brad Gerstner):
Anthropic 的 CEO 预测 2030 年 AI 模型和智能体将产生 1 万亿美元的收入。你觉得呢?
黄仁勋 (Jensen Huang):
我觉得他太保守了。Anthropic 的表现会远超这个数字。因为每一家企业软件公司未来都会成为这些 AI 模型的“增值经销商”。
主持人 (Brad Gerstner):
那这些公司的“护城河”是什么?
黄仁勋 (Jensen Huang):
深度专业化。不要只做一个通用的横向平台,而要深耕某个垂直领域,把你的专业知识注入智能体。谁先连接客户,谁就能获得数据飞轮。
主持人 (Jason Calacanis):
你三年前说过:“你不会被 AI 取代,但会被使用 AI 的人取代。”现在你对就业的看法有变化吗?
黄仁勋 (Jensen Huang):
我不是末日论者。虽然司机会减少,但“移动助手”会增加。就像飞机的自动驾驶增加了飞行员的数量一样。 我对年轻人的建议是:成为使用 AI 的专家。这需要艺术性,需要知道如何引导 AI 而不完全限制它。
主持人 (Brad Gerstner):
你曾在斯坦福建议年轻人要经历“痛苦和磨难”。现在你建议他们学什么?英语专业会比计算机专业更有前途吗?
黄仁勋 (Jensen Huang):
深厚的科学、数学和语言能力仍然关键。因为语言就是 AI 的编程语言。
看看放射科的例子:10 年前有人预言 AI 会让放射科医生消失。结果呢?放射科医生的需求量激增。因为 AI 让扫描变快了,医院能处理更多病人,收益更高。
一个增长更快的国家需要更多的老师、更多的专家,只是他们每个人都将拥有 AI 赋予的“超能力”。
主持人 (Jason Calacanis):
Jensen,祝贺你取得的成就。这是一场非常积极且令人振奋的对话。
黄仁勋 (Jensen Huang):
谢谢。我们不需要陷入恐慌,我们有自主权去选择如何创造未来。
英伟达 GTC26 财务分析师问答会主持人:
大家早上好。希望你们喜欢昨天的演示。虽然时间长了一点,但我认为这是一个非常完美的总结。现在我们将时间留给你们,重点关注你们的需求和问题。我先把时间交给 Jensen(黄仁勋)。
黄仁勋 (Jensen Huang):
正如我昨天提到的,AI 近期经历了三个拐点:第一个是生成式 AI,第二个是推理(Reasoning),而我们现在正处于第三个拐点——智能体系统(Agentic Systems)。
这些系统具备“自主行动能力”,所以被称为智能体。你可以给它们设定目标,它们不再只是回答问题,而是执行任务。最流行的应用之一就是编写软件。在你们公司,以及我的公司,工程师们整天都在使用智能体系统。
过去工程师入职发一台笔记本电脑,现在是发笔记本电脑和Token(代币/令牌)。Token 预算现在成了实实在在的东西。如果你雇了一个年薪 30 万美元的工程师,但他在工作中不消耗任何 Token,你得问问他整天在干什么。
未来的计算机不再仅仅是工具,而是生产设备。就像 ASML 的光刻机一样,它们生产的是可以出售的产品。这和很久以前生产电力的发电机(Dynamo)没什么区别。能源效率和生产效率决定了你的收入。
每一个软件公司、每一个企业现在都需要一个“OpenClaw 策略”,就像我们当年必须有 Linux 策略、互联网策略和移动云策略一样。
黄仁勋 (Jensen Huang):
我想更新一下关于订单可见性的情况。一年前我说过,到 2026 年,我们的 Blackwell 和 Reuben 出货量有 5000 亿美元的强劲可见性。
现在是 2026 年 3 月,我们对Blackwell 加 Reuben 架构拥有超过 1 万亿美元(1 Trillion Plus)的强劲需求可见性。这包括了确定的需求预测和采购订单。
请注意,这 1 万亿美元仅指 Blackwell 和 Reuben。我不包含 Groq、独立 CPU 或其他新产品,因为我要和去年的数据做对比。
而且,这个数字到 2027 年底还会继续增长。我们拥有库存和供应流水线,甚至可以在同一个季度内完成接单并出货。这是那些做 ASIC(定制芯片)的公司做不到的,因为它们的交付周期太长。
黄仁勋 (Jensen Huang):
去年(2025 年)是“推理之年”。我们让大家明白:计算机的价格和 Token 的成本之间只有微小的联系。人们买电脑是为了生产 Token。你买了一台昂贵的电脑,但它生产 Token 的速度极快,结果你反而拥有了成本最低的 Token。
这也是我们能保持毛利率的原因。我们每一代产品都提供更高的价值——即“每秒、每瓦特产生的 Token 数”。客户宁愿以更高的价格购买下一代产品,也不愿以低价买旧产品。安装 Vera Rubin 比继续买 Grace Blackwell 更聪明,因为价值更高。
黄仁勋 (Jensen Huang):
2025 年我们还扩大了平台支持。Anthropic 和 meta SL 都成为了我们的新合作伙伴。目前 API 推理服务提供商的数据显示,开源模型(Open Models)已成为全球第二大流行的 AI 模型类别,仅次于 OpenAI。而英伟达是开源模型在全球最好的运行平台。
我们还与云服务商(CSP)紧密合作。我们在他们的云端拥有 CUDA,这吸引了所有开发者。我们是云服务商最好的销售力量,所以你会看到 AWS、谷歌、微软、甲骨文在我们的展厅里拥有最大的展位,因为他们想向我们的开发者推销服务。
此外,我们 40% 的业务来自于非 CSP 领域,如区域云、工业企业等。如果没有英伟达的全栈平台,你根本无法触达这 40% 的市场,因为他们买的是“平台”,而不只是“芯片”。
问答环节 (Q&A)提问者 (Amelius Research, Ben Wright):
Jensen,大家最担心的推力是:这笔投资值吗?云服务商的收入增长能覆盖这些巨额开支吗?我们什么时候能看到他们的收入上修?
黄仁勋 (Jensen Huang):
我真希望那些 AI 公司已经上市了,这样你就能看到我所看到的。历史上从未有初创公司能像他们现在这样,每周增加 10 亿或 20 亿美元的收入。
2 万亿美元的 IT 软件行业正在整合 OpenAI、Anthropic 和开源模型。未来的 IT 行业将变成这些模型的“经销商”。我估计 IT 行业将从目前的 2 万亿增长到 8 万亿。
所有 IT 公司未来都会租赁或生产 Token。他们的商业模式将从软件授权转变为 Token 租赁。虽然这会引入销售成本(COGS),但提供的价值要高得多。OpenAI 和 Anthropic 的收入增长速度是在“一个月内长出一个完整的 IT 公司”。
提问者 (Caner Fitzgerald, CJ Muse):
物理 AI(Physical AI)会对你的业务构成什么样的变化?
黄仁勋 (Jensen Huang):
目前数字 AI 和物理 AI 的增长率差不多。但几年后物理 AI 迎来拐点,它必须在本地、在工厂边缘运行。由于全球 70 万亿美元的产业涉及物理原子(而非数字比特),物理 AI 最终会占据我们业务的 70%。
未来计算机将 24/7 全天候运行。我希望年薪 2000 美元一天的工程师每天能花 1000 美元的 Token 预算。我要让他管理一整支智能体舰队来替他工作。
提问者 (Bernstein, Stacy Rasgon):
Reuben 会和 Groq 一起发布吗?推理负载的演变如何?
柯莱特·克雷斯 (Colette Kress):
LPX(Groq 相关)预计在今年下半年。
黄仁勋 (Jensen Huang):
Vera Rubin 会比 Groq 更早出货。 关于计算架构,有低延迟(CPU)和高吞吐量(GPU)之分。Groq 是极端的低延迟架构,几乎整块芯片都是 SRAM。它不灵活,但非常快。
我们将 Groq 与 Vera Rubin 融合,用 Groq 处理语言模型自回归推理的最后阶段。对于免费或普通层级的推理,Vera Rubin 是无敌的。但对于极高端、极其聪明的模型,加入 Groq 后吞吐量会大幅提升。
这就像 iPhone 或汽车行业,市场扩大后就会出现分层:从免费层到极客层(每百万 Token 50 美元的高端层)。
提问者 (Bank of America, Vivek Arya):
1 万亿美元的市场里,CPU、存储等产品占比多少?Groq 会蚕食 HBM(高带宽显存)的需求吗?
黄仁勋 (Jensen Huang):
我们是唯一能跨 HBM、LPDDR5 和 SRAM 三种内存进行优化的公司。 如果 1 万亿的订单全部加上 Groq,规模会变成 1.25 万亿。存储是第二大支出,CPU 约占 5%。Vera Rubin 解决了“智能体”的计算需求——它不仅要推理,还要查内存、用工具、跑浏览器。
我们把这些功能全部和谐地整合进了一个液冷机架架构中,不再是“缝合怪”。
提问者 (Goldman Sachs, Jim Schneider):
Token 成本一直在下降,这会趋于平缓吗?
黄仁勋 (Jensen Huang):
Token 成本会持续下降。但与此同时,每个 Token 的“聪明程度”会持续上升。 评价 AI 工厂必须看“每瓦特产生的 Token 数”。任何不除以功耗的对比都是在误导。我们会不断推高帕累托前沿(Pareto Frontier)——即让工厂在同等成本下产出更多、更聪明的 Token。这是计算机科学中最难的问题。
提问者 (Evercore ISI, Mark Leatis):
SSM(状态空间模型)和 Neimotron 3 的混合架构对你们意味着什么?
黄仁勋 (Jensen Huang):
英伟达的架构美妙之处在于它支持一切:Transformer、扩散模型、SSM 等。Groq 跑不了扩散模型,但我们能跑。 Neimotron 3 旨在处理超长上下文。我们希望推进 AI 技术,而不是单纯竞争。
提问者 (UBS, Tim Aruri):
有人担心英伟达拿走了生态系统太多的价值,毛利率无法持续。你怎么看?
黄仁勋 (Jensen Huang):
如果你继续提供数倍的生产力提升,客户会很高兴与你合作。 这就像 TSMC(台积电)的晶圆是全球最贵的,但价值也是最高的,所以我乐意付钱。ASML 也是如此。 那些说“我的芯片便宜 30%”的人根本不懂 AI。他们不懂 AI 工厂的整体经济学。
提问者 (Redburn, Tim Schultzander):
你们的员工人数增长很慢,但任务量增长极快,如何平衡?
黄仁勋 (Jensen Huang):
我有 60 个直接下属。我们的公司架构反映了我们的产品架构。 为了每年更新一代产品,你必须完全拥有整个软件栈、存储和网络。你不能靠拼凑别人的技术来实现一年一更。我们拥有从芯片到操作系统(Dynamo)的一切,这让我们在第一天就能让旧软件在全新系统上完美运行。
提问者 (最后一位提问者):
训练的需求会如何演变?
黄仁勋 (Jensen Huang):
训练经历了预训练(幼儿园)到后训练(学技能)。后训练需要强化学习、工具使用等,其计算强度可能是预训练的百万倍。 未来的预训练将主要使用“合成数据”。我希望未来 99% 的算力都用于推理,因为推理是将 Token 转化为经济效益的过程。
这就是为什么英伟达去年全方位押注推理。推理就是“思考”和“工作”,怎么可能容易呢?推理只会变得越来越难。
黄仁勋 (Jensen Huang):
谢谢大家来到 GTC。





京公网安备 11011402013531号