当前位置: 首页 » 资讯 » 新科技 » 正文

华为发布AI新技术:单卡同时承载多AI工作负载 提升硬件资源利用率

IP属地 中国·北京 编辑:周伟 快科技 时间:2025-11-21 18:09:10

快科技11月21日消息,据媒体报道,华为今日正式发布Flex:ai AI容器软件。该产品的核心突破在于运用算力切分技术,可将单张GPU/NPU算力卡精细切分为多个虚拟算力单元,最小粒度精准至10%。

这一创新使得单张算力卡能够同时承载多个AI工作负载,显著提升硬件资源利用率。

同时,Flex:ai能够将集群内各计算节点的空闲XPU算力进行高效聚合,形成统一的“共享算力池”,实现算力资源的全局调度与灵活分配。

其核心技术原理是一套深度融合软硬件的系统工程,覆盖从底层芯片到顶层调度。通过创新性的软件技术深度挖掘硬件潜力,Flex:ai成功将GPU/NPU的典型利用率从30%-40%提升至70%,有效践行了“以软件补硬件”的理念。

在硬件协同方面,Flex:ai深度整合华为自研的昇腾AI处理器,通过软硬件协同设计优化,实现了最佳的性能功耗比。

特别在大模型训练场景中,Flex:ai通过软件层面的创新,实现了对包括英伟达GPU、昇腾NPU在内的多种异构算力资源的统一管理与调度,有效解决了当前大模型训练面临的算力效率瓶颈问题。

据悉,Flex:ai将在发布后同步开源在魔擎社区中,以促进技术共享与生态发展。

标签: 算力 技术 硬件 深度 华为 调度 利用率 软件 资源 协同 软件技术 底层 节点 产品 顶层 创新性 魔擎 性能 社区 功耗 开源 粒度 单元 理念 问题 瓶颈 效率 潜力 媒体报道 单张 单卡

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。