当前位置: 首页 » 资讯 » 新科技 » 正文

华为发布并开源Flex:ai AI容器,单卡同时承载多个AI工作负载

IP属地 中国·北京 IT之家 时间:2025-11-21 18:17:03

IT之家 11 月 21 日消息,在今日的 AI 容器应用落地与发展论坛上,华为发布 Flex:ai AI 容器软件,通过算力切分技术,将单张 GPU / NPU 算力卡切分为多份虚拟算力单元,切分粒度精准至 10%,实现了单卡同时承载多个 AI 工作负载,并可聚合集群内各节点的空闲 XPU 算力聚合形成“共享算力池”。


Flex:ai 是一款基于 Kubernetes(开源容器编排平台)构建的 XPU(各种类型处理器)池化与调度软件,主要是通过对 GPU、NPU 等智能算力资源的精细化管理与智能调度,实现对 AI 工作负载与算力资源的“精准匹配”。


相比英伟达旗下 Run:ai 公司的核心技术,华为认为 Flex:ai 具备两大独特优势:

一是虚拟化。除了在本地虚拟化技术中实现算力单元的按需切分,Flex:ai 独有的“拉远虚拟化”技术,可以不做复杂的分布式任务设置,将集群内各节点的空闲 XPU 算力聚合形成“共享算力池”。二是智能调度。Flex:ai 的智能资源和任务调度技术,可以自动感知集群负载与资源状态,结合 AI 工作负载的优先级、算力需求等多维参数,对本地及远端的虚拟化 GPU、NPU 资源进行全局最优调度,满足不同 AI 工作负载对资源的需求。

IT之家从发布会获悉,Flex:ai 将在发布后同步开源在魔擎社区中


免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。