华为轮值董事长徐直军:未来3年,昇腾芯片将以“几乎一年一代算力翻倍”的速度演进
中国基金报记者 王建蔷
9月18日,华为全联接大会2025在上海召开,华为轮值董事长徐直军分享了昇腾芯片未来三年的发展规划路线,并推出全球最强超节点和集群。
他透露,未来3年,华为开发和规划了三个系列,分别是Ascend(昇腾)950系列以及Ascend 960、Ascend 970系列,更多具体芯片还在规划中。此外,以昇腾芯片为基础,华为推出多款超节点和集群产品,到2027年昇腾超节点集群规模将达到百万卡级。
未来3年
昇腾芯片将以“几乎一年一代算力翻倍”的速度演进
徐直军认为,尽管DeepSeek模式减少了算力需求,但走向AGI和物理AI,算力仍是关键,尤其是对中国人工智能而言。
他明确表示,未来3年至2028年,华为规划了Ascend 950、960、970三个系列昇腾芯片,将以“几乎一年一代算力翻倍”的速度演进,同时,围绕易用性、数据格式、带宽等方向优化,满足AI算力增长需求。
徐直军介绍,Ascend 950系列(含Ascend 950PR和Ascend 950DT两颗芯片)共用Ascend 950 Die,相比前代有四大根本性提升:一是新增支持FP8/MXFP8/MXFP4等低数值精度格式,算力达1P和2P,还支持自研HiF8,精度接近FP16;二是通过提升向量算力占比、采用双编程模型新同构设计、减小内存访问颗粒度,大幅提升向量算力;三是互联带宽达2TB/s,较Ascend 910C提升2.5倍;四是自研HiBL1.0和HiZQ 2.0两种HBM,与Die合封构成不同芯片。
他表示,Ascend 960计划于2027年四季度推出,在算力、内存访问带宽等规格上较Ascend 950全面翻倍,还支持自研HiF4数据格式,“这是目前业界最优的4bit精度实现,能进一步提升推理吞吐,且比业界FP4方案推理精度更优”。
据徐直军透露,Ascend 970部分规格仍在讨论,初步计划FP4算力、FP8算力、互联带宽较 Ascend 960翻倍,内存访问带宽至少增1.5倍,“大家可以期待它的惊人表现”。
他总结称,从Ascend 950开始,相比910B/910C,芯片引入SIMD/SIMT新同构提升易用性,支持更丰富数据格式,互联带宽、算力、内存容量和访问带宽均大幅提升。
以昇腾芯片为基础
发布三款超节点产品和两款集群产品
结合已经推出或正在研发中的昇腾芯片,华为将推出更多超节点和集群产品。
徐直军发布Atlas 950超节点、Atlas 960超节点、TaiShan 950超节点三款超节点产品,并推出灵衢互联协议,以应对AI算力需求增长。
他认为,超节点已成为AI基础设施主导产品形态,“超节点事实上就是一台能学习、思考、推理的计算机,物理上由多台机器组成,但逻辑上是一台”。
大规模超节点对互联技术提出挑战,徐直军坦言,设计Atlas 950、960时面临两大难题:一是长距离高可靠,当前电互联距离短、光互联可靠性不足;二是大带宽低时延,现有技术带宽和时延无法满足需求。
对此,华为开创超节点架构和新型互联协议“灵衢(UB,UnifiedBus)”。徐直军指出,万卡级超节点架构应具备总线级互联、平等协同等六大特征,灵衢协议支撑万卡级超节点“像一台计算机一样工作、学习、思考、推理”。
徐直军宣布,华为开放灵衢2.0技术规范。“灵衢研究始于2019年,基于1.0的Atlas 900已商用部署300多套,2.0在1.0基础上优化完善,Atlas 950就是基于2.0。”他表示,开放灵衢2.0是为促进产业进步,“欢迎产业界伙伴基于灵衢研发相关产品和部件,共建灵衢开放生态。”
此外,他还宣布推出两个集群产品。首先是Atlas 950 SuperCluster集群。“相比当前世界上最大的集群xAI Colossus,规模是其2.5倍,算力是其1.3倍,是当之无愧的全世界最强算力集群。无论是当下主流的千亿稠密、稀疏大模型训练任务,还是未来的万亿、十万亿大模型训练,超节点集群都可以成为性能强悍的算力底座,高效稳定地支持人工智能持续创新。”他说。
在2027年四季度,华为还将基于Atlas 960超节点,同步推出Atlas 960 SuperCluster,集群规模进一步提升到百万卡级。
编辑:黄梅
校对:王玥
制作:小茉
审核:陈思扬
版权声明
《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。
授权转载合作联系人:于先生(电话:0755-82468670)