当前位置: 首页 » 资讯 » 新科技 » 正文

200亿美元拿下Groq,英伟达“史上最大收购”到底图啥?

IP属地 中国·北京 钛媒体APP 时间:2025-12-26 20:22:56

文 | 超聚焦

黄仁勋,又动用他的“钞能力”了。

12月24日,据华尔街日报消息,英伟达与Groq已达成非独家许可协议,将把Groq的AI推理技术整合进未来产品中。作为交易的一部分,Groq创始人兼首席执行官Jonathan Ross、总裁Sunny Madra以及部分核心员工将加入英伟达。

而此前CNBC援引投资机构Disruptive的报道称,此次交易金额将达到200亿美元,且将以现金形式进行支付。

该金额如果属实,此次收购Groq也将成为英伟达成立三十多年以来金额最高的收购案,远超当年对Mellanox70亿美元的价格。

那么,Groq到底是什么来头?它究竟掌握了什么样的核心科技,值得英伟达顶着反垄断审查的压力斥巨资购买?这桩交易究竟只是简单地对AI推理技术的获取,还是隐藏着英伟达的某些“私心”呢?

Gorq为何让英伟达顶着反垄断审查也要收购?

Groq不生产GPU,它生产的是一种名为LPU的“速度怪兽”,旨在彻底颠覆冯·诺依曼架构。

想要读懂Groq这家企业,必须先了解的创始人Jonathan Ross。

在硅谷,Ross被很多人称为“芯片界的叛逆者”。在创立Groq之前,他是谷歌TPU项目最早的推动者之一。正是他领导开发的TPU,让谷歌在这一轮AI算力竞赛中抢占了关键的先机。

但就在外界将TPU视为行业标杆时,Ross却早已发现了问题。他意识到,无论是GPU还是TPU,本质上都只是在传统的冯·诺依曼架构上“打补丁”,勉强适配不断膨胀的AI模型需求。尤其在面对越来越复杂的推理任务时,硬件往往处于被动等待软件调度的低效状态。而这条勉强走下去的路,终有尽头。

Ross想做的,是开辟一条全新的道路,而这也是Groq被创立的初衷。

Ross认为,AI时代的计算不应该是随机的、波动的、依赖复杂调度的,而应该是“确定”的。于是,在他带领下的Groq,提出了一种全新的处理器类别——LPU。

LPU的核心逻辑与英伟达的GPU完全背道而驰。

GPU的本质是并行计算,它像是一个拥有数千名普通工人的工厂,虽然能同时干很多活,但每个人之间的沟通、任务的分配和缓存的调度极其复杂。

这种复杂度在处理图形渲染时是优势,但在处理大模型推理时,却变成了致命的延迟。当你向大模型提问,数据在GPU内部流转时,由于复杂的调度逻辑,每一层计算完成的时间是不确定的。这就导致了所谓的“推理卡顿”。

而Groq做的最疯狂的一件事,是彻底取消了硬件层面的调度器。

在LPU的世界里,你可以理解为“软件定义硬件”。这意味着,在代码编译阶段,编译器就已经计算好了每一比特数据在芯片内每一纳秒的位置。LPU就像一条精确到微秒的自动化生产线:第一纳秒数据进入加法器,第二纳秒进入寄存器,第三纳秒输出。

这种“确定性架构”让LPU彻底告别了延迟波动,也让整个AI业界感到颤栗。

在去年年底的评测中,当英伟达的最强显卡在处理大规模上下文时,因为显存带宽和调度瓶颈陷入“沉思”时,Groq的LPU却跑出了每秒500到800个Token的恐怖速度。

这不仅是数值上的领先,更是体验上的质变,它真正让AI从一个“好用的工具”变成了“实时的智力”。

更具颠覆性的是,Groq还挑战了英伟达GPU的基石——HBM。

目前,英伟达芯片之所以价格昂贵且产能受限,很大程度上是因为它极其依赖三星和海力士提供的HBM。而Groq剑走偏锋,它使用SRAM来取代HBM。

SRAM的带宽比HBM还要高出几个数量级,延迟更低,唯一的缺点是容量小。但Groq通过集群设计,用成百上千块芯片互联,构建出了一个超低延迟的“显存池”。

这种设计逻辑不仅在性能上完成了超越,更在供应链层面完成了对英伟达的侧翼进攻。Groq的LPU不需要昂贵的显存封装,也不那么依赖极其复杂的CoWoS封装工艺,这意味着它具备更强的量产潜力。

在AI行业从“不计成本训练”转向“大规模商业推理”的2025年,Groq拿出的这套方案,无异于在英伟达的铁幕上凿开了一道透光的裂缝。

正是因为Groq已经做出了这种能够从底层重构AI推理的产品,它才成为了黄仁勋眼中那个必须被立刻“锁定”的目标。

收购Groq或许是英伟达最好的“防守”

在硅谷的商业逻辑里,收购通常分为两类:一类是获取市场占有率的“补全型”,另一类则是消除生存威胁的“扼杀型”。英伟达收购Groq,显然两者兼而有之。

尽管目前的英伟达依然凭借CUDA生态和Hopper/Blackwell架构统治着全球AI算力市场,但这台疯狂吸金的机器并非没有软肋。黄仁勋非常清楚,AI的下半场属于推理。

当大模型的训练尘埃落定,成千上万的企业开始部署应用时,市场对算力的需求将从“大力出砖飞”的吞吐量,转向对“毫秒级响应”的极致追求。而这恰恰是英伟达当前的短板。

而此次收购Groq,就有“锁死”竞争对手推理能力快速发展的考量。

在Groq成名之前,其实全球的云服务巨头和初创公司早就在寻找“除英伟达以外的选择”了。而经过多年的自研,谷歌有了TPU,亚马逊有了Trainium,微软有了Maia。这些巨头试图通过自研芯片来摆脱英伟达的“税收”,并已经看到了曙光。

但对于那些没有自研能力的二线云厂商和AI软件公司来说,Groq原本是他们手中最有力的谈判筹码:一旦Groq的LPU集群大规模部署,其极高的能效比和恐怖的推理速度,将直接解构英伟达H100/B200在推理端的性价比优势。

黄仁勋此举,本质上是“釜底抽薪”。通过将Groq收入囊中,英伟达不仅获得了一项足以颠覆市场的技术,更重要的是,它让那些试图绕过英伟达、通过Groq构建差异化竞争力的对手们瞬间失去了目标。

其次,英伟达正在经历从“通用芯片”向“专用推理架构”的产品开发。

GPU虽然全能,但在推理效率上始终背负着冯·诺依曼架构的沉重包袱。Groq的“确定性架构”和“软件定义硬件”的思路,正是英伟达目前最稀缺的补丁。

通过整合Groq的核心团队,英伟达可以将LPU的低延迟特性深度融入其下一代超级芯片中。这意味着,未来的英伟达产品可能不再是单纯的GPU,而是一个融合了并行计算与确定性流处理的“算力怪兽”。

这将极大推动英伟达纯推理产品的开发进度,也将保证英伟达后续的竞争力。

与其被动等待一个由Groq引领的、可能颠覆自己的新架构时代,不如主动拥抱并将其内化。英伟达可以凭借其无与伦比的工程化、软件生态和规模化能力,将Groq的前沿理念快速产品化、市场化。

这相当于在自身巨轮上,加装了一台为推理时代量身定制的、动力澎湃的新引擎。

从斥巨资入股英特尔、OpenAI、xAI,到如今顶着审查压力强推Groq的收购案,黄仁勋正身体力行地诠释着什么叫“用钱买出一个未来”。

收购Groq,本质上是英伟达利用先发优势积累的庞大现金流,为自己买下了一张通往“后GPU时代”的船票。

它不仅通过“扼杀式”收购清除了一个潜在的颠覆者,更通过技术内化,试图将Groq那种令人窒息的推理速度融入CUDA生态的血液里。

在AI这场没有终点的军备竞赛中,英伟达正在构筑一道前所未有的护城河:这条护城河不仅由先进制程和软件生态堆砌,更由那些足以颠覆自己的“叛逆技术”所构成。

老黄的逻辑很简单:如果有人要颠覆英伟达,那个人最好就是英伟达自己。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新