环球网
12月20日,摩尔线程在首届MUSA开发者大会(MDC 2025)上,系统展示了其在全功能GPU领域从架构创新、集群能力到生态建设的突破。
其中最引人关注的是新一代GPU架构“花港”的亮相,以及可支撑万亿参数模型训练的“夸娥”万卡智算集群的实际效率披露。
架构迭代:“花港”亮相,双芯片路线瞄准AI与图形
大会的核心发布之一是新一代全功能GPU架构“花港”。根据摩尔线程公布的信息,该架构在计算密度上提升50%,效能提升最高达10倍,并完整支持从FP4到FP64的全精度计算。尤为关键的是,架构层面集成了自研的MTlink高速互联技术,为十万卡规模以上的集群扩展提供了底层支持。
![]()
“生态体系是GPU行业的核心护城河与价值所在。”摩尔线程创始人、董事长兼CEO张建中在主题演讲中强调。他透露,基于“花港”架构,公司已规划两款芯片:专注于AI训练与推理一体化的“华山”,以及瞄准高性能图形渲染的“庐山”。其中,“庐山”在图形性能上宣称实现数量级提升,AI计算、几何处理及光线追踪性能分别提升64倍、16倍和50倍。
这一架构与产品路线的发布,标志着摩尔线程不再局限于单一场景的加速卡产品,而是向覆盖AI计算、图形渲染、科学计算等全场景的“全功能GPU”平台迈进。在业内人士看来,这既是技术能力的体现,也是应对市场多元需求、构建更宽生态护城河的战略选择。
集群能力:万卡训练效率指标首度公开
如果说芯片架构是“点”的突破,那么集群能力则是“面”的验证。本次大会上,摩尔线程首次系统披露了其“夸娥”万卡智算集群的关键工程效率指标,使其成为国内少数公开万卡级实际训练效率的厂商之一。
数据显示,该万卡集群在训练稠密(Dense)大模型时,模型算力利用率(MFU)达到60%,训练混合专家(MOE)模型时MFU为40%,训练线性扩展效率达95%,有效训练时间占比超过90%。这些指标,特别是MFU,是衡量超大规模AI集群实际效能的关键,其数值直接关系到训练的总体成本与可行性。
“虽然构建国产万卡乃至十万卡级别的超大规模智算系统存在难度,但这是必须完成的产业基础设施任务。”中国工程院院士、清华大学计算机系教授郑纬民在大会演讲中说道。他认为,国产计算显卡与国外主流产品的性能差距正在持续缩小,而集群能力的突破是发展“主权AI”、实现“算力自主”不可或缺的一环。
在推理侧,摩尔线程联合硅基流动,在DeepSeek R1 671B全量模型上实现了性能突破。经优化后,MTT S5000单卡在Prefill阶段吞吐量突破4000 tokens/s,Decode阶段突破1000 tokens/s。这一数据为国产GPU在超大规模模型推理场景树立了新的性能基准,也反映了从硬件到软件系统级调优的成效。
生态开放:从软件开源到开发者赋能,构筑长期壁垒
硬件与集群的突破之外,本次大会的另一条主线是生态的开放与赋能。摩尔线程宣布,其自主统一的软件架构MUSA已迭代至5.0版本,并计划逐步开源包括计算加速库、通信库及系统管理框架在内的核心组件。
“开发者是生态建设的关键,国产芯片平台必须构建起友好、易用的开发环境。”郑纬民院士特别强调了开发者在生态中的核心作用。为降低开发门槛,摩尔线程发布了搭载自研“长江”智能SoC的AI算力本MTT AIBOOK,提供端侧50TOPS算力,旨在实现从芯片到开发环境的全栈整合与“开箱即用”。
同时,其面向开发者的“摩尔学院”平台已汇聚近20万学习者,并通过校企合作覆盖全国超200所高校。这种从底层技术开源、到开发工具供给、再到人才早期培养的全链路生态建设思路,折射出国产GPU企业对于行业规律的理解——生态的构建是一场需要长期投入、多方协同的马拉松。
技术融合与前沿探索:图形、AI与科学计算交汇
本次发布也揭示了GPU技术演进的前沿趋势:即图形、AI与高性能计算的深度融合。摩尔线程宣布,基于“花港”架构实现了硬件级光线追踪加速,并推出了自研的AI生成式渲染技术MTAGR 1.0,推动渲染从“计算”走向“生成”范式。
此外,公司已在具身智能、科学智能(AI for Science)、AI for 6G等前沿交叉领域展开布局,发布了具身智能仿真训练平台MT Lambda及相应的机器人解决方案。这些举措表明,其技术路线并非仅追逐单一的AI算力,而是着眼于GPU作为通用计算平台在未来更广阔场景中的渗透与价值重塑。
自主算力进入“系统攻坚”与“生态破局”深水区
摩尔线程此次的全栈技术展示,从一个侧面反映了当前国产高端算力发展的阶段特征:从单点芯片的“从无到有”,正进入需要攻克超大规模系统工程、构建繁荣应用生态的“深水区”。
万卡集群的效率公开,意味着国产算力基础设施已开始接受大规模、高负荷实际场景的检验。而架构的迭代、图形与AI的融合,以及对科学计算等前沿领域的探索,则展现了企业试图参与定义下一代计算架构的技术布局。
然而,通往成熟生态的道路依然漫长。硬件性能的持续提升、软件栈的深度优化、与国内外主流开发框架及应用的广泛兼容,以及吸引足够数量和质量开发者形成网络效应,均是摆在所有国产GPU厂商面前的共同课题。
此次,随着“花港”架构及后续芯片路线图的公布,摩尔线程已将其技术蓝图进行详细披露。然而,能否将全栈自研的技术实力,真正转化为可持续的开发者生态与行业渗透力,仍将是一场考验定力、协作与市场智慧的长期工程。这也将推动国产高端算力的发展,从单点突破驶入系统攻坚与生态构建的深水区。





京公网安备 11011402013531号