当前位置: 首页 » 资讯 » 新科技 » 正文

AMD 发布 ROCm 7.0,剑指 NVIDIA CUDA 生态

IP属地 中国·北京 IT之家 时间:2025-09-17 16:15:52

IT之家 9 月 17 日消息,科技媒体 Wccftech 昨日(9 月 16 日)发布博文,报道称 AMD 为打破英伟达 CUDA 在 AI 领域的垄断,发布 ROCm 7.0 计算软件堆栈,官网页面显示支持最新算法和模型、扩展 AMD 锐龙 AI 处理器和 AMD Radeon 显卡支持等。


图源:AMD

AMD 官方已经发布 ROCm 7.0 更新日志,其中最值得关注的改进,在于优化 AI 推理任务。AMD 宣称,在 DeepSeek R1 基准任务中,Instinct MI355X 的 FP8 吞吐量比 NVIDIA Blackwell B200 高出 30%。IT之家附上相关截图如下:


图源:AMD

AMD 还提供了 ROCm7 的实测结果,相比较 ROCm 6,在 Llama 3.1 70B 模型上性能提升 3.2 倍,Qwen2-72B 上性能提升 3.4 倍,而 DeepSeek R1 性能提升 3.8 倍。


图源:AMD

功能升级方面,ROCm 7.0 集成了最新算法与模型、先进的 AI 扩展特性、对 MI350 系列 GPU 的支持,以及集群管理与企业级功能,这些改进旨在提升大规模 AI 部署的可扩展性与稳定性。

新版本引入对 Instinct MI355X、MI350X 的支持,并新增 Ubuntu 24.04.3 与 Rocky Linux 9 系统兼容,同时淘汰了旧版 Ubuntu 与 SLES 15 SP6。

AI 框架支持也同步更新,包括 PyTorch 2.7、TensorFlow 2.19.1、onNX Runtime 1.22.0、JAX 0.6.0、Triton 3.3.0、vLLM 等。相关数学库、通信库与工具链全面提档,进一步提升大模型和 HPC 场景表现。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。