当前位置: 首页 » 资讯 » 新科技 » 正文

AI芯片市场群雄逐鹿!亚马逊自研芯片上新,下一代还将支持与英伟达互联

IP属地 中国·北京 澎湃新闻 时间:2025-12-03 16:25:11

电商巨头亚马逊继续在云计算领域发力,自研AI(人工智能)产品如期上新。

当地时间12月2日,亚马逊云科技(AWS)在2025 re:Invent全球大会上宣布了一系列AI产品上新,包括第三代定制AI芯片Trainium3和三款全新前沿AI Agent(AI助理)的正式推出。AWS的CEO马特·加曼(Matt Garman)表示:“Trainium如今已经是一项数十亿美元规模的业务,并且仍在快速增长。”

Trainium是AWS为AI训练和推理任务设计的自研芯片系列,旨在在保持高性能的同时,大幅降低模型训练与部署的整体成本。在去年的全球大会上,AWS首次宣布了Trainium3。

据介绍,作为公司旗下第一款采用3纳米工艺节点制造的芯片,Trainium3性能较上一代提升4倍,与同等GPU系统相比,可将AI模型训练和运行成本降低40%。每颗芯片配备144 GB HBM3E高带宽内存,提供4.9 TB/s的内存带宽,并可实现略高于2.5 PFLOPS的密集FP8运算性能。

在此基础上,搭载Trainium3的服务器Amazon EC2 Trn3 UltraServer能够提供极高密度的训练算力,容纳多达144个Trainium3芯片,AI算力峰值达到362 PFLOPs(FP8精度)。在FP8级别,这些系统的性能大致与英伟达基于Blackwell Ultra的GB300 NVL72系统相当,而在FP4级别依然存在显著差距。


Trainium3正式面市。AWS

同时,AWS确认公司正在开发下一代Trainium4芯片。该芯片预计在FP4精度运算下将运算性能提升6倍,内存带宽提升4倍,内存容量增加2倍。AWS还透露,在合作伙伴英伟达的帮助下,Trainium4将支持英伟达的NVlink Fusion高速互连技术,意味着Trainium4将能够在英伟达的MGX机架中与GPU无缝协同工作,为客户提供更灵活的混合架构选择。

目前,已有多家AWS合作客户采用了Trainium3。其中,AI生成视频公司Decart表示,使用Trainium3进行实时视频生成的推理速度提升了4倍,而成本仅为此前使用GPU加速运算的一半。Anthropic和理光(Ricoh)等客户也通过采用Trainium芯片,成功降低了高达50%的训练与推理成本。

另一方面,AWS还透露了与Anthropic合作的“雷尼尔计划”(Project Rainier)计划的最新进展:启动一年后,该计划已连接超过50万颗Trainium2芯片,成为全球最大的AI运算集群之一,其规模是Anthropic训练上一代模型时的5倍。

此外,AWS在本次大会上推出三款全新的前沿AI Agent,具备自主性与可扩展性,能够在无需持续干预的情况下连续工作数小时乃至数天。其中,Kiro自主Agent能够独立完成任务并在工作中持续学习;Amazon Security Agent负责在应用设计、代码审查与渗透测试等环节充当安全顾问;Amazon DevOps Agent则能够协助团队解决并预防运行故障。

Trainium系列持续上新,意味着亚马逊也在持续进军AI芯片行业。今年11月,谷歌发布公司第七代自研TPU(张量处理单元)芯片Ironwood。随后,有消息称meta正在考虑从2027年起在其数据中心部署谷歌的TPU,价值达到数十亿美元,导致英伟达股价一度大跌。

不过,和英伟达以及谷歌相比,亚马逊的Trainium芯片缺乏有深度且易于使用的软件库。除了亚马逊自己以及公司大力投资的AI初创企业Anthropic外,还没有其他大规模采用Trainium芯片的知名公司。这或许也解释了,亚马逊为何将支持英伟达NVlink作为下一代芯片的一大亮点。

AWS计算和机器学习副总裁Dave Brown在接受外媒采访表示:“AI芯片市场的多样性是一件好事......我们的客户希望能够不断获得更强的计算能力和更高的性能,更重要的是,价格还要更低。”而负责Trainium项目的AWS副总裁兼首席架构师直言:“我不认为我们会试图取代英伟达。”

2日当天,据大智慧VIP,亚马逊(Nasdaq:AMZN)涨0.23%收于每股234.42美元,总市值2.51万亿美元。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。