写在开头
在市场中,主流甜品级产品始终是玩家关注的焦点。随着 NVIDIA Blackwell 架构的推出,GeForce RTX 50 系显卡带来了多项革命性升级。本次评测的主角 —— 影驰 GeForce RTX 5060 圣刃 OC 8GB 显卡,作为 RTX 50 系的重要拼图,不仅继承了 Blackwell 架构的核心优势,更在性价比与性能表现上展现出强大竞争力。它搭载了第五代 Tensor 核心、第四代 RT 核心、GDDR7 显存以及突破性的神经网络着色器,同时首次支持 DLSS 4 多帧生成技术,力求为玩家带来更高效的渲染效率、更逼真的光影效果与更流畅的游戏体验。接下来,我们将从架构革新、硬件设计以及性能表现等维度,带大家领略这张甜品卡的实力。
规格介绍
开始前,照例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI领域推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学领域留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell可以说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来说,划时代的引入了神经网络着色器,力图为游戏开创先进、高效更有逼真的渲染方式,带给玩家全新的游戏体验。
相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新、显存能效的提升以及划时代的神经网络渲染。
第五代Tensor核心
其中AI算力的爆发就不得不提到Blackwell架构上的第五代Tensor核心,新一代Tensor核心添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。
第四代RT核心
而光线追踪技术的革新则仰赖于第四代RT核心的加持,相较于第三代RT核心来说,Blackwell架构的第四代RT核心主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。
综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。
第四代RT核心的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。
该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。
另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。
GDDR7显存
第三点改变则是显存效率的提升,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成了PAM3,NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话就是,新的编码机制可以使杂讯失真比减小,信号品质更清晰,同时还能带來更高的显存运行频率以及更低的电压,根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。
神经网络着色器
接着我们再细说一下这一代架构最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。
在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。
这里举个例子让大家能够更简单的理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。
目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入到DirectX中,玩家能够体验到更真实的游戏世界。
而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。
另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代Tensor核心也能共同分担着色工作,大大提高了着色效率。
这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到Tensor核心上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可编程渲染管线,现在开发者或API也能更好的调用Tensor核心,未来游戏内我们能见到的AI技术势必越来越多。
先进的AI管理处理器
此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,亦或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。
而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好的保障。
GeForce RTX 5060 8GB规格
说了这么多,接下来给大家介绍一下GeForce RTX 5060 8GB的硬件规格,作为RTX 50系的最后一块拼图,核心采用了新的GB206芯片,核心代号为GB206-250-A1。在架构上拥有3个GPC,但每个GPC包含的TPC并不相同。GeForce RTX 5060 8GB上总共集成了18个TPC,30个SM单元,120个TMUs纹理单元,48个ROPs光栅化处理单元以及3840个CUDA核心。
在工艺制程方面,新的GB206芯片沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。核心面积为181mm2,内部晶体管数量则有219亿,虽然在芯片面积以及晶体管数量上相比上代少了一些,不过得益于更先进的架构设计,GeForce RTX 5060 8GB的CUDA核心数比上代多出了25%。基础频率与Boost频率也有小幅上升,由原来的1830MHz与2460MHz提升至现在的2280MHz以及2497MHz,想必性能也有不小的长进。
除此之外,GeForce RTX 5060 8GB还配备了全新的GDDR7显存,显存等效频率可达28Gbps,同时视频输出接口也进行了升级,能够兼顾高分辨率与高刷新率,后续开箱显卡时我们会详细介绍。
最后一点区别就是售价了,全新上市的GeForce RTX 5060 8GB MSRP版本官方建议零售价为2499元,对比上代的GeForce RTX 4060 8GB稍微提升了100元左右。不过更先进的架构设计与更激进的性能释放,还有25%的规格提升,绝对是主流玩家的甜品之选。
显卡外观赏析
接下来让我们看看这款显卡的真面目,外观设计方面,影驰GeForce RTX 5060 圣刃 OC 8GB与之前的圣刃系列显卡几乎一样,纯白的导风罩,周边配有一些符咒等符号进行点缀,具备很高的视觉辨识度。
正面还有三把全新的90mm霜环风扇坐镇,每把风扇为7扇叶结构,环状扇叶结构设计,扇叶表面还有三折处理,这样子风扇即使是高转速运行,也能够有不错的稳定性与噪音表现。
接着看看显卡的背部,其背板采用全金属打造,同时延续了白色的设计风格。尾部还加上了圣刃系列的标识,让显卡颜值更进一步。
显卡背板的另一侧则采用大面积开窗设计,这样能够让风流自下而上吹出,减少了积热,有效增强了散热能力。
视线来到显卡的一侧,影驰GeForce RTX 5060 圣刃 OC 8GB显卡所配备的影驰LOGO的灯光模块采用了磁吸设计,用户可以自由选择将其安装在显卡的侧面或尾部。
在磁吸光模块旁边还有一段英文,写着“blade of chaos,hear my chant,seal thyself,power banished”,简单翻译下就是“混沌之刃,听我的咏唱,封印自身,放逐力量”,满满的二次元气息。
显卡的顶部就比较常规了,中央是磁吸光模块接口,而一侧则是NVIDIA显卡经典的“GEFORCE RTX”标识。
显卡的供电接口也安排在显卡顶部,不同于70级别及以上的RTX 50系显卡,影驰 GeForce RTX 5060 圣刃 OC 8GB为单8Pin接口,应对145W的TGP完全足够。
视频输出接口方面,还是经典的3个DP加1个HDMI的配置,不过规格上有了升级,为DP 2.1b与HDMI 2.1b规格。理论上,这一代显卡的视频输出接口可以轻松实现4K 480Hz和8K 240Hz超高分辨率与超高刷新率的需求。
另外,从这个角度还可以看出这款显卡非常苗条。显卡的外观设计符合SFF-Ready尺寸要求,其具体尺寸为,含挡板:316.5*140*40mm,不含挡板:304*125*40mm,这样的设计更便于玩家组建紧凑型ITX/M-ATX小钢炮。
显卡拆解赏析
下面是显卡拆解环节,拆解影驰GeForce RTX 5060 圣刃OC 8GB还是比较简单的,仅需拧下背板与侧边IO面板的螺丝即可分离PCB与散热器。
拆开后先看看显卡的PCB设计。与之前的RTX 5060 Ti类似,影驰GeForce RTX 5060 圣刃OC 8GB的PCB完全可以用小巧玲珑来形容。这个尺寸完全可以做成ITX显卡!
PCB的背面就比较整洁了,几乎都是一些控制芯片。
PCB的中央则是显卡的核心——GB206-250-A1,影驰GeForce RTX 5060 圣刃OC 8GB就靠它驱动,规格方面,核心由TSMC 4N工艺打造,拥有3840组CUDA核心,数量上对比RTX 4060要高出约25%左右,这也就意味着它的通用图形性能会更强,不过实际性能提升究竟有多少,还请接着往下看。
核心的四周则被4颗显存芯片包围,规格上是GDDR7,由三星提供,单颗2GB,共8GB。显存型号为K4VAF325ZC-SC28,内部是512M×32的架构,根据其型号后缀“SC-28”也可以知道,这些显存的数据频率可达28Gbps。
供电部分,影驰GeForce RTX 5060 圣刃OC 8GB采用公版的4+2相供电设计,对于一张功耗只有145W的显卡来说,这样的供电规格是完全没有任何问题的
左侧是4相核心供电,每相供电均配上了固态电容、全封闭电感,以及DrMos芯片
PCB的右侧则是2相显存供电,同样配备了独立的DrMos芯片。
下面看看这款显卡的散热设计,整张显卡的散热系统还是相当有份量的,整个散热系统可分为三部分,分别是散热器主体、金属背板以及主动散热风扇。
率先映入眼帘的就是正中间这个大面积且非常厚实的镀镍铜底座。四周是影驰为显存、电感等部件准备的高导热系数的导热垫。
整个显卡散热模组还是非常硕大的,可以分为左右两个部分,左侧是密密麻麻的散热鳍片,配合气流,能够快速带离热量,提升整体冷却效能。散热鳍片之下则藏有3根核心热管,其为GPU核心及显存散热提供了高效的散热保障。
主动散热就是外观部分给大家介绍过的霜环散热风扇了,搭配上面介绍的核心热管、镀镍铜底座以及大面积的散热鳍片,共同为每位玩家提供了无与伦比的散热性能和极其安静的使用体验。
测试平台介绍
开始性能测试前介绍一下本次的测试平台, CPU使用的是目前毫无争议的游戏神U—— Ryzen R7-9800X3D,则是来自微星的MPG X870E CARBON WIFI 暗黑主板。内存为G.Skill的幻锋戟Z5 RGB DDR5,在这块主板上能轻松达成DDR5-8000 C38的成绩,并且我们这次选用的是24G×2的套条,确保这张显卡能够释放全部性能。
完整测试平台如下所示:
理论性能测试
开始测试前,照例还是要“认识”一下这张显卡。从GPU-Z的信息中可以看到影驰GeForce RTX 5060 圣刃 OC 8GB的基准频率为2280 MHz,Boost频率为2535MHz,毕竟是带着OC后缀的型号,其Boost频率对比MSRP版本的RTX 5060要高出不少,由2497 MHz提升到了2535MHz,这也意味着其性能释放更强劲一些。除此之外,这张显卡的TDP也比前代稍高一些,为145 W。并且换装了更高级的GDDR7显存,能够带来448 GB/s的显存带宽,对比前代的272 GB/s提升明显。
在理论性能测试 3DMark 中,影驰 GeForce RTX 5060 圣刃 OC 8GB 在 Fire Strike 系列测试里的表现相当出色。在 1080P 分辨率下,相比 RTX 4060 能领先大概 38%,和 RTX 4060 Ti 对比也有 20% 左右的性能提升;来到 2K 分辨率,它领先 RTX 4060 约 40%,比 RTX 4060 Ti 高出约 18%;而到了 4K 分辨率,优势更为明显,对比 RTX 4060 有 46% 的提升,对比 RTX 4060 Ti 也有 19% 的领先幅度。
除了 Fire Strike,该显卡在以 DX12 为基础的 Time Spy 测试中同样表现出色,和 RTX 4060 相比,领先幅度达到 33% 左右,对比 RTX 4060 Ti 大约领先 5-6%,整体性能提升幅度还是比较可观的。
另外,在光追项目测试中,影驰 GeForce RTX 5060 圣刃 OC 8GB 的得分高达 8795,这一成绩比 RTX 4060 Ti 还要高出 10%,对比 RTX 4060 则高出 45%,性能提升幅度堪称代际升级。而在最新的 Speed Way 测试中,这款显卡对比 RTX 4060 也有超过 32% 的性能提升。
DLSS 4专项测试
看完了理论性能部分的测试,接着我们再来看看本次RTX 50系显卡最“顶”的升级,DLSS 3在RTX 40系显卡上引入了帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。
而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。无论是对性能、显存的开销还是延迟都比之前要好了许多。
另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能的将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。
同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟系了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。
不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,超过75款游戏和应用将在GeForce RTX 50系列开售时支持DLSS 4的全新DLSS多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》等。随着时间的推移,支持DLSS 4的游戏和应用数量将不断增加。
简单介绍完,我们再看看DLSS 4的理论表现如何,在 3DMark DLSS 4 专项测试中,影驰 GeForce RTX 5060 圣刃 OC 8GB 展现出颠覆性性能提升:2K 分辨率下,开启 DLSS 4 前后的帧数差距达到4 倍,而4K 分辨率下更是达到了夸张的7 倍性能鸿沟。
接着我们看看DLSS 4在实际游戏中的表现,率先登场的就是有着“显卡杀手”之称的《赛博朋克2077》,它的设置页面是目前支持DLSS 4游戏中最为丰富一款,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能改善此前的拖影问题,对玩家可以说是一大利好。
我们直接来一波对比,左侧为Transformer模型,右侧则是原本的CNN模型。从第一个场景来看,Transformer模型能够带来更多的细节。例如左侧图片中的栏杆倒影,这部分表现是比较清晰的,而CNN模型中则几乎不可见。
第二个场景也是能够一眼看出区别的,例如金属门的纹理细节以及砖墙的接缝处,明显是Transformer模型的优化要更好一些。
这个场景的区别主要在于地板细节刻画以及右侧铁栏杆部分,采用Transformer模型的情况下,地板细节更接近真实世界,并且铁栏杆的细节也能更好的还原。而CNN模型则会丢失比较多的细节,虽然不影响观感,但总有种“失真感”。
不过Transformer模型目前也并非万能,毕竟是由AI生成而来,因此在部分细节上还是有些错误的。例如下方的窗口部分,阳光照射下应该是斑驳的光影,比较正确显示的应该是CNN模型中的样式。整体来看,现在Transformer模型瑕不掩瑜,大幅改善的画面细节能够给玩家带来更精致的游戏展现。
见识完Transformer模型的魅力以后,我们再来看DLSS 4的性能表现,毕竟是“显卡杀手”,对显卡的压力确实不一般,在最高画质+路径追踪的情况下,影驰GeForce RTX 5060 圣刃 OC 8GB只能跑20 FPS,果然全景光追的压力不容小觑。开启DLSS 3以后,游戏帧数为85 FPS,体感已经非常流畅了。开启DLSS 4以后,影驰GeForce RTX 5060 圣刃 OC 8GB能够做到153 FPS,对比原生分辨率,性能足足提升了7.6倍,这在以前的甜品卡身上,完全不敢相信。
DLSS 4带来的性能提升是有目共睹的,不过也有玩家担心DLSS 4的画质表现如何,这里我们也在游戏中截取了部分画面,第一个场景其实差距不大,肉眼很难分辨出区别。
第二与第三个场景还是能够看出部分细节的,例如第二幅图中的霓虹灯牌,DLSS开至性能档以后,能够看到灯牌与前面三张图有些许差异,不过你得靠细致的对比才能看出。实际游戏过程中很难发现,基本不影响观感。
总的来说,DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。如果你是敏感型玩家,那建议可以开至平衡档,在画面质量和帧率之间能够做到很好的平衡。如果你是追求超高帧率,那性能档也绝对可用,细节保留也不错,不对比基本看不出,同时帧率还能进一步提高。
第二款游戏则是NVIDIA在前段时间强力推荐的《半条命2》RTX版,这款游戏不仅支持了DLSS 4,同时也在游戏中加入了RTX神经网络辐射相关的技术,与初始版本的《半条命2》相比,画质可以说是史诗级的进步!
实测下来,只能说《半条命2》RTX版对硬件的开销极大,在原生1080P分辨率下,所有画质、光追均开至最高,不开启超分选项时,影驰GeForce RTX 5060 圣刃 OC 8GB帧数为44 FPS。在开启DLSS 3质量档以后,游戏帧数来到了84 FPS,几乎快摸到高刷的门槛了,而继续开启DLSS 4质量档,游戏帧数飙升至156 FPS,对比原生1080P的表现,性能提升高达3.5倍!1%Low的表现也差不多,领先幅度接近4倍。
DLSS 4的画质也表现极佳,这里我们还是在游戏中截取了部分画面,基本上可以说DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。
另外,游戏设置中也可以切换DLSS 4的另一个特性——Transfomer Mode,这里我们也截图了相同的场景进行对比,从下图可以看出Transformer模型能够带来更多的细节。例如左侧图片中的墙壁,这部分表现是比较清晰的,细节也更多,而CNN模型中则几乎不可见。图片中主体的木屋纹理也是Transformer模型下会更清晰,线条更锐利。
我们测试的第三款DLSS 4游戏是《霍格沃兹之遗》,支持DLSS 4技术以后可以在设置看到帧生成部分多了一些选择,其中×2则是原本DLSS 3的帧生成,而×4则是RTX 50系独有的多帧生成功能,另外你也可以选择插2帧的方式,也就是所谓的×3选项。
实际测试过程中,我们发现《霍格沃兹之遗》这款游戏优化还是不错的,1080P分辨率画质光追均设置最高的情况下,影驰GeForce RTX 5060 圣刃 OC 8GB在不开任何超分的情况下,平均帧为65 FPS。如果开启DLSS 3质量档,此时帧数已经能够做到108 FPS了,属于是高刷与画质的完美组合,体验相当丝滑。开启DLSS 4以后,帧数可以进一步提升至176 FPS,对比原生1080P的表现,性能提升了约3倍左右。
第四款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持×4的选项,也就是DLSS 4多帧生成功能。
实测DLSS 4在这类优化欠佳的游戏中确实大有用处,在1080P原生分辨率下,影驰GeForce RTX 5060 圣刃 OC 8GB的平均帧仅有77 FPS,整体游玩体验还不错。而开启DLSS 4质量档以后,游戏平均帧直接暴增至250 FPS,游戏体验如德芙般丝滑,对比原生1080P的表现,足足有2.7倍左右的提升。即便是对比DLSS 3的145 FPS,也是足足提升了100+ FPS。
接下来我们再测一下第一款国产3A大作、去年的热门单机游戏《黑神话:悟空》,去年发售时,这款游戏也是率先支持了DLSS 3帧生成功能,如今它还支持了RTX 50系显卡的DLSS 4多帧生成,游玩体验将会更加顺畅,开启方式也很简单,在游戏菜单设置中即可找到4X的选项。
我们在1080P下将画质调整至影视级,全景光追也拉到最高,此时影驰GeForce RTX 5060 圣刃 OC 8GB在不借助任何超分技术的条件下,游戏帧数仅有35 FPS。而有DLSS 3的帮助后,游戏帧数也回到了流畅的水准87 FPS;这时如果你有RTX 50系显卡,开启DLSS 4多帧生成以后,游戏帧数将再度飞跃,135 FPS的表现相当夸张,对比原生分辨率提升了快4倍,直接由可玩变爽玩了。
网游方面我们测的是《漫威争锋》,这款游戏在RTX 50系显卡首发之时,它还没有完全适配DLSS 4,玩家想要体验多帧生成功能还需要依靠NVIDIA App的DLSS 4优设功能。不过现在《漫威争锋》也正式支持DLSS 4了,与上面的游戏一样,玩家在游戏设置中就能直接开启,并且提供了2x、3x以及4x选项,玩家可以随意选择是插一帧、插两帧还是插三帧。
影驰GeForce RTX 5060 圣刃 OC 8GB在1080P全高设置下,不开超分,帧数为91 FPS。开启DLSS 3后帧数可以达到189 FPS,相比原生分辨率已经提升了一倍以上,如果再开启DLSS 4多帧生成,性能对比原生分辨率直接提升3倍以上,315 FPS的表现应该叫极致丝滑。同时延迟以及1%Low表现也非常出色,反应在游戏中会更加跟手,体感更佳。
最后一款游戏我们测的是最近刚支持DLSS 4的《毁灭战士:黑暗时代》,实测影驰GeForce RTX 5060 圣刃 OC 8GB在1080P分辨率、超级噩梦画质下,表现还是非常不错的,即便不开启超分,也能流畅游戏;开启DLSS 3质量档后,游戏帧数已经能够满足高刷需求了,接着启动DLSS 4质量档后,游戏帧数更是来到了250 FPS以上,完全的爽玩水准。
当然,如果你想玩的游戏还不支持DLSS 4,那也不用担心,NVIDIA App还提供DLSS 4优设功能,说人话就是能够让游戏强开DLSS 4,像此前的《漫威争锋》,在未更新前,玩家可以直接在NVIDIA App中简单设置,就能将帧生成调至“4×”,一键实现多帧生成。目前也有不少游戏支持DLSS 4优设功能,感兴趣的玩家可以前往体验。
DLSS 4多帧生成功能的问世,毫无疑问为玩家带来了前所未有的游戏体验升级。过往甜品卡战2K仿佛天方夜谭,如今影驰GeForce RTX 5060 圣刃 OC 8GB在DLSS 4的加持下,不仅能够畅玩1080P,甚至2K乃至4K都有可能。与上一代RTX 40系的DLSS 3帧生成功能相比,它更是实现了帧数的惊人飞跃。在相同的画质设置下,影驰GeForce RTX 5060 圣刃 OC 8GB的表现远远超越了前代的RTX 4060。实际测试中,在上述七款游戏里,开启DLSS 4的影驰GeForce RTX 5060 圣刃 OC 8GB,帧数几乎是RTX 4060的两倍!在部分极其吃硬件的游戏如《黑神话:悟空》中,帧数甚至可以做到三倍,非常夸张!RTX 5060+DLSS 4 的组合,正在重新书写 1080P/2K 分辨率下的游戏体验标准。
另外,值得一提的是,与DLSS 4一起到来的还有全新的NVIDIA Reflex 2技术。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,这其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显的感觉到游戏的不流畅、卡顿。
为了尽可能的降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。
而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。
另外,frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。
而当frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是现在NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。
首发支持NVIDIA Reflex 2技术的游戏是《THE FINALS》以及《无畏契约》,后续我们也会第一时间带给大家该技术的详细评测。
游戏性能测试
作为RTX 50系显卡的核心竞争力之一,DLSS 4技术凭借颠覆性的多帧生成能力,为游戏性能带来了革命性提升。接下来我们将通过3DMark基准测试与实际游戏场景,继续探索影驰GeForce RTX 5060 圣刃 OC 8GB的常规游戏性能。
首先是3DMark的DLSS 3性能测试。影驰GeForce RTX 5060 圣刃 OC 8GB在2K分辨率下,对比RTX 4060,性能提升幅度非常夸张,达到了82%,对比RTX 4060 Ti则是25%;4K分辨率下,开启DLSS 3以后,对比RTX 4060性能领先也基本维持在80%以上,而对比RTX 4060 Ti同样拉开了不小的差距,接近40%的性能提升只能说老黄确实有点东西。
实际游戏表现又如何呢?这里我们选取了10款游戏进行测试,包含光追及光栅性能方面的测试,而游戏画质方面均全部选择最高画质,光追设定部分,如有则采用最高。
实测,在 1080P 分辨率下,影驰 GeForce RTX 5060 圣刃 OC 8GB 轻松应对所有测试项目,甚至展现出越级挑战 2K 分辨率的实力:《F1 22》《光明记忆:无限》《漫威争锋》等优化出色的作品中,帧率稳定突破 200+ FPS;即便是硬件压力极大的《黑神话:悟空》《赛博朋克 2077》全高设置下,仍能保持 87 FPS 的流畅表现,轻度降低画质即可解锁 144Hz 高刷体验。综合性能方面,影驰 GeForce RTX 5060 圣刃 OC 8GB 在常规游戏性能上整体超越 RTX 4060 约 20%,对比 RTX 4060 Ti 也有近 10% 的性能反超。
图像视频创作性能测试
接下来要进行的是图像视频的创作性能测试,影驰 GeForce RTX 5060 圣刃 OC 8GB 依旧延续了游戏领域的巨大提升,再度展现出显著的代际优势。首先通过 PCMark 10 Extended 综合测试可见,其在游戏性能与数位内容创作场景中的表现尤为突出:相较 RTX 4060 领先幅度达 12%-31%,面对更高定位的 RTX 4060 Ti 亦实现约 10% 的性能提升。值得注意的是,其生产力项目得分暂时偏低,推测与现阶段驱动优化尚未完全到位有关。
图像编辑与视频创作环节我们则采用 UL Procyon 进行测试:在图像编辑任务中,影驰 GeForce RTX 5060 圣刃 OC 8GB 与 RTX 4060 Ti 表现旗鼓相当,而对比 RTX 4060 则保持 9% 的性能优势;进入视频剪辑场景,该显卡的优势进一步放大,相较 RTX 4060 和 RTX 4060 Ti 分别实现 18% 与 15% 的领先。
针对 Adobe 生态与达芬奇 Resolve 的专项 Benchmark 测试显示,影驰 GeForce RTX 5060 圣刃 OC 8GB 在视频编辑环节展现出碾压级优势 —— 依托第 9 代 NVENC 编码器的升级,不仅编解码效率大幅提升,更支持包括 AV1 UHQ 在内的新一代视频格式,在 Premiere Pro 与达芬奇的实际工程测试中,对比前代两款 60 级显卡的性能提升均超过 20%。
3D渲染创作性能测试
在 3D 渲染创作性能测试环节,影驰 GeForce RTX 5060 圣刃 OC 8GB 继续展现出强劲实力。首先在 Blender 与 V-Ray 两款行业主流软件中,其表现令人瞩目:Blender 渲染测试中,该显卡较 RTX 4060 领先约 20%,面对定位更高的 RTX 4060 Ti 也能保持势均力敌的竞争态势;而在 V-Ray 渲染测试中,影驰 RTX 5060 圣刃 OC 8GB 实现压倒性优势,对比 RTX 4060 领先幅度超过 30%,相较 RTX 4060 Ti 亦有 20% 的显著优势。
再看看另外一款渲染器,D5 Render是一款基于DXR和光线追踪技术构建的GPU渲染器。正因为其有光线追踪技术,其渲染的画面相当出色。这款软件在RTX 40系显卡测试时支持了DLSS 3帧生成,而现在随着RTX 50系显卡的发布,它也可以通过NVIDIA App的方式支持最新的DLSS 4多帧生成功能。
实测中,搭载 DLSS 4 的影驰 RTX 5060 圣刃 OC 8GB 呈现出跨代际的性能提升 —— 渲染预览界面流畅度达到电竞级水准,帧数稳定在 136 FPS 左右,这种接近高刷新率显示器原生帧率的实时渲染体验,为创意工作者提供了前所未有的交互效率,彻底革新了传统 GPU 渲染的工作流。
工业级性能测试采用 SPEC2020 基准程序,该测试覆盖多维度工业应用场景。影驰 RTX 5060 圣刃 OC 8GB 在多项子项目中平均领先 RTX 4060 约 20%,部分复杂计算任务的领先幅度更甚;与 RTX 4060 Ti 对垒时,两款显卡在不同专业场景中各有优势,展现出旗鼓相当的综合工业性能,充分证明其不仅适用于消费级市场,也能在轻量化工业设计领域发挥重要作用。
NVIDIA编解码测试
接下来的测试则是介绍RTX 50系显卡的编解码器,在视频编解码能力方面,影驰 GeForce RTX 5060 圣刃 OC 8GB 搭载了第 9 代 NVENC 编码器与第 6 代 NVDEC 解码器,首次支持 AV1 UHQ(超高画质 AV1)和 MV-HEVC(多视角 HEVC)编解码标准。配合升级的 DisplayPort 2.1 UHBR20 输出接口,单通道带宽可达 20Gbps,为用户带来极致 HDR 视觉体验、超高分辨率画质及流畅的游戏画面输出。
我们采用 NVIDIA 提供的 4K60 片源及工程文件,实测不同编码格式下的导出效率:影驰 GeForce RTX 5060 圣刃 OC 8GB 处理同一段素材时,AV1、H.265、H.264 格式的导出时间分别为 16 秒、15 秒、15 秒,较前代两款同级别显卡效率提升 60%-80%,充分展现了新一代编解码器的强大性能。
在画质对比测试中,AV1 编码视频与 H.265、H.264 格式在文字锐度、人像肤色还原、建筑细节等方面表现近乎一致,非专业用户难以通过肉眼分辨差异。随着主流视频平台、后期软件及硬件厂商对 AV1 格式的支持度持续提升,这一高效编码标准正加速成为行业新宠。
值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。上面的图表里也可以看到我们的测试成绩,实测导出时间会比上代显卡快不少,毕竟RTX 40系显卡不支持该功能,仅支持4:2:0色度采样,如果一定要4:2:2导出只能靠CPU软解。
4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。
AI性能测试
在 AI 功能测试环节,我们覆盖了当下热门的本地大语言模型部署及文生图等应用场景。在深入解析影驰 GeForce RTX 5060 圣刃 OC 8GB 的 AI 性能之前,先来了解 RTX 50 系显卡在 AI 领域的核心升级 —— 对 FP4 精度模型加速处理的支持。相较于前代 RTX 40 系采用的 FP8 精度,这一技术革新实现了更迅捷的生成速度,同时显著降低显存占用,为中端显卡的 AI 运算效率带来质的飞跃。
实测数据也印证了这一技术优势:前代两款 60 级显卡受限于显存容量,未能完成测试任务。而配备 8GB 显存的影驰 GeForce RTX 5060 圣刃 OC 8GB,凭借 FP4 精度模型支持,不仅顺利通过测试,在文生图场景中生成单张图片仅耗时 21.16 秒,展现出同级别产品中优异的运算效率。
而在 Stable Diffusion 图像生成测试中,我们继续采用 UL Procyon 基准程序,分别测试 FP16 精度下的性能表现。在压力较小的 SD 1.5 文生图任务中,影驰 GeForce RTX 5060 圣刃 OC 8GB 展现出碾压级优势,单图生成时间仅 3.66 秒,较前代显卡效率提升 37%。面对更高负载的 SDXL 模型,其性能优势依然显著,单图生成时间 30.9 秒,相较 RTX 4060 领先幅度达 22%,充分体现了新架构在复杂 AI 任务中的优化成效。
转向本地大模型部署场景,我们基于 meta 开源的 Llama 2 7B 大语言模型,通过 MLPerf Client v0.5 进行四项典型 AI 任务测试,涵盖内容生成、创意写作及不同长度文本的摘要总结。影驰 GeForce RTX 5060 圣刃 OC 8GB 在所有测试项目中均展现出压倒性优势:对比 RTX 4060 Ti 性能提升 20%,相较 RTX 4060 更是实现 30% 的大幅领先。
进一步通过 UL Procyon 的 AI Text Generation 测试平台,对更多大语言模型进行性能验证,影驰 GeForce RTX 5060 圣刃 OC 8GB 延续了强劲表现:综合性能较 RTX 4060 提升约 27%,面对更高定位的 RTX 4060 Ti 也保持着 13% 的领先优势,全面彰显了 RTX 50 系显卡在 AI 推理与生成任务中的架构优势和优化成果。
功耗与温度表现
评测的最后一项是烤机测试,得益于影驰 GeForce RTX 5060 圣刃 OC 8GB出色的散热配置,整体表现非常出色。在室温20℃下,Furmark烧机10分钟后,整张显卡的温度并不高,核心与显存温度都低于60度,非常凉快。显卡的最大功率则为145 W,风扇转速则是1570 RPM,噪音与温度控制优秀。
接着我们再横向对比一下前代显卡,虽然新显卡的TDP提升了,不过整体的烤机功耗并不算高,影驰 GeForce RTX 5060 圣刃 OC 8GB整体的散热效果极其出色,待机时温度甚至比115W的RTX 4060还要低,属于是非常惊喜了。
评测总结
作为一款定位甜品级的显卡,影驰GeForce RTX 5060 圣刃OC 8GB的表现可圈可点,几乎给主流玩家交上了一份不错的答卷。凭借全新NVIDIA Blackwell架构和GDDR7显存实现了跨代提升,各方面也堪称“完美”。
要说最惊喜的肯定是它的性能释放表现,实测数据显示,影驰 RTX 5060 圣刃 OC 8GB 在常规游戏性能上全面超越前代 RTX 4060 约 20%,甚至对比 RTX 4060 Ti 也有近 10% 的反超。而在 DLSS 4 多帧生成技术的加持下,其性能更是有跨越式提升:在《赛博朋克 2077》《黑神话:悟空》等硬件杀手级游戏中,开启 DLSS 4 后帧数较原生分辨率提升 3-7 倍,DLSS 4 的 Transformer 模型还能带来画质升级,实现 “帧数与画质兼得” 的体验。
外观方面这款显卡也很有自己的特色,影驰GeForce RTX 5060 圣刃 OC 8GB采用了全新的金属装甲设计,白色无光设计简约圣洁,颜值非常高,非常适合海景房或纯白主题装机。同时,这款显卡的供电配置与散热堆料也不错,能够给玩家带来更高的效能、更好的散热效果和更安静的噪音表现。
最后聊聊售价,影驰 GeForce RTX 5060 圣刃 OC 8GB定价2599元,性价比还是非常高的。其通过 AI 算力、光追效率、显存性能与神经网络渲染的全面升级,重新定义了 1080P/2K 分辨率下的游戏体验。DLSS 4 的颠覆性加持,使其在帧率表现上甚至超越前代的RTX 4060 Ti,而出色的散热设计与生产力性能,更让其成为兼顾游戏、创作与 AI 应用的全能型选手。如果你正寻求一款能畅玩未来 3年主流游戏,同时满足轻度创作需求的显卡,这款 “甜品级” 显卡无疑是不容错过的选择。