当前位置: 首页 » 资讯 » 新科技 » 正文

谷歌加快TPU部署步伐,与英伟达在AI芯片领域竞争升级

IP属地 中国·北京 编辑:冯璃月 华尔街见闻官方 时间:2025-09-04 04:08:42

谷歌是英伟达人工智能芯片最大的买家之一,并将这些芯片租赁给Google Cloud的客户,如OpenAI和meta Platforms。然而,谷歌发展自家AI芯片的雄心并未减缓。

据七位参与相关谈判的人士对媒体透露,谷歌近期接洽了一些以租赁英伟达芯片为主的小型云服务商,提出希望他们的数据中心也能部署谷歌的AI芯片。

据参与该交易的公司代表私下对媒体透露,谷歌已经与至少一家云服务商达成协议,其中包括总部位于伦敦的Fluidstack,后者将在纽约的数据中心部署谷歌的张量处理单元(TPU)。

此外,谷歌也曾尝试与其他专注英伟达芯片的云服务商达成类似协议,比如正为OpenAI打造一个部署大量英伟达芯片的数据中心的Crusoe公司,以及向微软和OpenAI租赁英伟达芯片的CoreWeave。

媒体称,目前尚不清楚谷歌首次选择在其他云服务商的数据中心部署TPU的原因。分析认为,这可能是因为谷歌自建数据中心的速度赶不上对芯片的需求增长,也可能是希望通过其他云服务商为其TPU寻找更多新客户,比如AI应用开发者。这种做法与云服务商租赁英伟达显卡的模式类似。

分析称,如果是后一种情况,谷歌的做法就等于更直接地与英伟达竞争,毕竟英伟达主要是向这些云服务商销售芯片。无论出于什么目的,在其他云服务商的数据中心部署TPU,都会意味着这些设施使用的英伟达GPU数量会减少。

投资公司D.A. Davidson的股票研究分析师Gil Luria团队对媒体表示,越来越多的云服务商和大型AI开发商对TPU感兴趣,希望借此摆脱对英伟达的依赖。他们在与多家前沿人工智能实验室的研究人员和工程师交流后发现,业内对谷歌这款为机器学习和AI定制的加速芯片评价正面。

因此,分析师团队认为,如果谷歌将TPU业务与旗下AI研究机构DeepMind合并并单独剥离上市,市场将有强劲需求。根据Luria团队的估算,这项业务的潜在估值约为9000亿美元,而在今年早些时候,他们的估值还是7170亿美元。

“没人愿意只有一个来源……在关键组件上完全受制于某一供应商。”
“如果这项业务真的被剥离,投资者将同时获得一家领先的AI加速芯片供应商和一家顶级AI实验室,这可能会成为Alphabet最具价值的资产之一。”

而英伟达首席执行官黄仁勋则对这种竞争芯片项目泼了冷水。他对媒体表示,AI应用开发者更偏好GPU,因为它们用途更广,支持的软件也更强大。

拉拢英伟达的“朋友”

媒体报道,谷歌的谈判表明,它正在设法接近那些英伟达重点扶持的新兴云服务商。这些公司与Google Cloud和Amazon Web Services不同,它们几乎只租赁英伟达芯片,而且比传统云服务商更愿意采购多样化的英伟达产品。英伟达还向这些公司投资了资金,并优先供应最热门的芯片。

谷歌主要将TPU用于开发自家的AI模型,比如Gemini系列,而近年来内部对TPU的需求大增。

不过,谷歌也长期向其他公司租赁TPU。例如,Apple和Midjourney都通过Google Cloud租用TPU。而在今年夏季初,谷歌甚至一度让OpenAI对租用TPU感兴趣,但OpenAI随后突然改变了主意。

谷歌内部曾讨论扩大TPU业务,以增加收入并减少云计算部门对昂贵的英伟达芯片的依赖。据两名前高管对媒体透露,高层也曾探讨过将TPU直接销售给Google Cloud以外的客户。

分析认为,像CoreWeave和Fluidstack这类小型云服务商,例如Fluidstack为Mistral这类创业公司提供英伟达GPU,由于AI开发者普遍偏爱英伟达产品,因此在商业上有强烈动机优先提供英伟达芯片服务器。

但谷歌似乎已经找到办法促使Fluidstack支持其TPU扩张计划:如果Fluidstack无法承担即将启用的纽约数据中心的租赁成本,谷歌将提供最多32亿美元的“兜底”支持。这项承诺帮助Fluidstack及其数据中心合作伙伴筹集债务融资以建造设施。

TPU需求正在上升

媒体称,谷歌的第六代Trillium TPU芯片自去年12月向外部客户开放后需求强劲。分析师预计,第七代Ironwood TPU的需求将“显著上升”。Ironwood是Google首款专为大规模AI推理任务(即模型训练完成后的部署运行)设计的芯片。

分析师指出,谷歌的TPU芯片算力最高可达42.5 exaflops(百亿亿次浮点运算),并已大幅提升高带宽内存容量。这些芯片“成本效率也显著提升”,这是吸引更多前沿实验室关注的主要原因之一。

初创公司Anthropic此前虽在小规模上使用TPU,但分析师指出,该公司近期正在招聘TPU内核工程师,这可能意味着他们正考虑从使用Amazon Web Services提供的Trainium芯片转向TPU。Trainium是亚马逊为AI训练设计的芯片,该公司已对Anthropic投资80亿美元。

分析师还指出,马斯克的xAI公司也对购买TPU表现出兴趣,部分原因在于今年“JAX-TPU工具支持的显著改进”。JAX是谷歌开发的一个高性能计算Python库,能够让程序在TPU上高效运行。分析师指出,直到最近,JAX生态系统还限制了TPU在Google外部大规模部署的可能性。

根据D.A. Davidson的DaVinci开发者数据集,2025年2月至8月这半年内,Google Cloud上与TPU相关的开发者活跃度增长了大约96%。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。