英特尔于2025年8月宣布了其 “战斗矩阵” 项目的最新软件更新,并推出了 LLM-Scaler1.0容器,以优化 Intel Arc B 系列显卡的 AI 推理支持。
早在今年5月,英特尔就宣布了 “战斗矩阵” 项目,旨在支持多达八块 Intel Arc Pro GPU 用于 AI 推理,并提供 SR-IOV 支持、改进的 vLLM 性能等多项新功能。英特尔的目标是在第三季度实现产品可用性,并在年末前实现全面功能。
此次发布的 LLM-Scaler1.0被描述为 “一个专为 Linux 环境构建的新容器化解决方案,优化以提供卓越的推理性能,支持多 GPU 扩展和 PCIe 点对点数据传输,并设计包括 ECC、SR-IOV、遥测及远程固件更新等企业级的可靠性和可管理性特性。” 此版本的发布还整合了新的 vLLM 性能优化、各种新 vLLM 功能,以及更好的多模态模型支持。
LLM-Scaler1.0容器还包含 oneCCL 基准支持和 XPU 管理器集成,为各种 GPU 遥测功能提供了便利。此外,其他增强功能也得到了更新。
在英特尔官网的公告中,他们提到下一步将推出更为稳固的 LLM Scaler 版本以及其他新功能,预计将在第三季度结束前完成。全面功能的发布仍按计划在第四季度进行。
划重点: