IT之家 3 月 14 日消息,开源平台 Coelacanth-Dream 昨日(3 月 13 日)发布博文,发现 AMD 针对 RDNA 5 GPU 全面优化指令级性能,在部分负载场景下有望实现 GPU 性能近乎翻倍。
该平台长期追踪 Linux 系统补丁,发现 AMD 在近期提交的代码中,针对 RDNA 5 GPU 架构,计划引入双发射向量算术逻辑单元(Dual Issue VALU),实质性增强 FP32(单精度浮点)的运算能力,从而惠及多种高负载应用场景。
![]()
IT之家注:双发射向量算术逻辑单元是一种处理器硬件设计,通俗来说可以想象一个收费站原来只有一条车道(单发射),现在开了两条车道(双发射),在同一时间内(一个时钟周期)可以处理两辆车(两条指令),理论上效率翻倍。
双发射向量算术逻辑单元并非 RDNA 5 的专属新技术,AMD 早在 RDNA 3 和 RDNA 4 时代就已将其引入硬件架构。该技术配备双 ALU(算术逻辑单元)通道,支持 GPU 在单个时钟周期内同时执行两条指令。
![]()
然而在过去几代产品中,游戏引擎编译器缺乏有效手段来对齐代码,导致硬件虽然具备双发潜力,却无法高效地对计算任务进行分组与调度,最终限制了实际性能的释放。
AMD 为突破这一调度瓶颈,在 RDNA 5 架构中引入了融合乘加(FMA)指令。简而言之,FMA 指令能协助编译器轻松配对复杂的 ALU 操作,并将其顺畅地分发至双计算通道中。
得益于这项调度技术的完善,GPU 现在能够如预期般充分利用双发射 VALU 的硬件资源,更轻松触及理论性能峰值,进而实现业界期待的“性能翻倍”效果。
落实到实际用户体验中,在传统光栅化游戏中,这项底层技术革新将为玩家带来更高且更稳定的帧率表现。
![]()
与此同时,FMA 指令对神经网络和 AI 工作负载同样至关重要,它将深度赋能 AMD 下一代 AI 驱动的图像超分技术(如 FSR Diamond)与帧生成技术。





京公网安备 11011402013531号