当前位置: 首页 » 资讯 » 新科技 » 正文

科技投资大佬:明年英伟达GPU将颠覆谷歌TPU优势

IP属地 中国·北京 华尔街见闻官方 时间:2025-12-10 12:32:51

英伟达新一代Blackwell芯片及其后续产品将在明年重塑AI训练的成本结构,有望终结谷歌TPU在成本上的优势。

12月9日,科技投资大佬Gavin Baker接受播客采访时表示,谷歌凭借TPU芯片在AI训练领域占据了低成本优势。

Baker指出,在半导体时代,谷歌TPU芯片相当于拥有"四代喷气式战斗机",而英伟达的Hopper芯片还停留在"二战时代的P-51野马"水平。这种成本优势使谷歌能够以负30%的利润率运营AI业务,有效"抽干AI生态系统的经济氧气"。

Baker强调随着英伟达Blackwell芯片集群在2026年初开始投入训练使用,以及更易部署的GB300芯片随后上市,这一局面即将逆转。一旦谷歌失去成本优势,可能重塑AI产业的竞争格局和经济模型。

Blackwell的复杂转型造就谷歌窗口期

Blackwell的延迟部署为谷歌创造了意外的优势窗口。

Baker认为,从Hopper到Blackwell的过渡是科技史上最复杂的产品转型之一:数据中心机架重量从约1000磅增至3000磅,功耗从30千瓦跃升至130千瓦,冷却方式从风冷转为液冷。Baker形象地比喻:

这就像要使用新iPhone,你必须将家中所有插座改为220伏,安装特斯拉电池墙、备用发电机、太阳能板和全屋加湿系统,还要加固地板。

正因为这些技术挑战,Blackwell芯片直到最近三四个月才开始大规模部署。

而如果不是推理技术的突破,AI进展本会在2024年中期至Gemini 3发布期间完全停滞。推理技术有效"拯救了AI",在新一代芯片到来前填补了约18个月的空白期

Baker预计,基于Blackwell训练的首批模型将在2026年初问世,预计将由xAI率先推出。

Baker强调xAI为英伟达扮演了关键角色。他们快速的部署速度使得英伟达能够在一个数据中心中,尽可能多部署GPU来形成连贯集群,从而为所有客户排除故障。这种"coherent"(连贯)意味着每个GPU都知道其他GPU的状态,通过scale-up网络和scale-out连接共享内存。

更关键的是,英伟达即将推出的GB 300芯片将具有"即插即用"的兼容性,能够直接替换现有GB 200机架,无需额外的基础设施改造,垂直整合的公司将成为新的低成本生产者。

TPU架构决策限制未来竞争力

谷歌在TPU开发上的保守设计选择和供应链策略,可能限制其长期竞争力。

Gavin Baker指出,谷歌将TPU的前端设计留给自己,但将后端设计外包给博通,后者从中收取50-55%的毛利率。

以2027年TPU业务规模约300亿美元估算,谷歌每年要向博通支付约150亿美元。Baker指出,考虑到博通半导体部门的运营成本仅约50亿美元,从经济角度看,谷歌完全有理由将整个半导体项目收归内部。

Baker表示苹果正是采取这种模式,不依赖ASIC合作伙伴,自己完成前端后端设计,从而避免支付50%的利润。

Baker认为谷歌已经开始采取行动,引入联发科就是作为对博通的“警告”。这家中国台湾ASIC公司的毛利率远低于博通。

但这种供应商的分化也导致谷歌在设计上更加保守,使TPU的发展速度难以跟上英伟达GPU的年度迭代节奏。

相比之下,英伟达和AMD的策略是"每年推出一款GPU,让竞争对手无法跟上"。而谷歌通过引入联发科作为第二供应商,实际上是向博通发出警告信号,但这种分散供应可能进一步拖慢TPU进化速度。

战略计算将发生根本转变

一旦谷歌失去最低成本生产商地位,其战略计算将发生根本性改变。

作为低成本生产商,以负利润率运营AI业务以压制竞争对手在经济上完全合理——这可以削弱需要外部融资的竞争对手,最终获得主导市场份额。

但当Blackwell集群转向推理应用,成本动态改变后,继续维持负30%利润率对谷歌来说将变得"非常痛苦",甚至可能影响其股价表现。这将对整个AI产业的经济格局产生深远影响。

Baker强调,Ruben下一代芯片推出后,英伟达GPU与TPU及其他ASIC之间的差距将进一步扩大。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。