照理说,新产品发布一类的文章托尼都是在工作日给大家写的,因为厂商们通常选择在工作日开发布会。
但是这家名叫 “砺算科技” 的厂商很神奇,他们周末加了个班( 被迫着我也加了个班 ),但是发布的东西却堪称非常重磅了 ——
首款国产自研 6nm 工艺显卡!
没错,是能插在电脑上打游戏的那种显卡,而且按照砺算在发布会上的说法,这款显卡的光栅性能赶超了英伟达的 RTX 4060,甚至还能稳玩 1080P 的黑猴?看完昨天咱们国内企业 “砺算科技” 的新品发布会,说实话托尼到现在人还是懵的。
因为根据相关报道,砺算科技截至 2024 年仅仅募资 6.28 亿,但是作为对比,我们每天都在骂贵的英伟达、骂不争气的英特尔和 AMD,他们哥仨的研发投入动辄就是几百亿。国内芯片创业公司用着十几分之一的资源“手搓”出了 4060 级别的显卡???
假如事情是真的,那这真的妥妥是一个 “显卡圈子” 的 DeepSeek 故事了。
不过着急看这两款产品详细测试的小伙伴估计要再等一等了,昨天发布的消费级显卡 7G106,及专业级显卡 7G105,不出意外应该是 8 月份产品送样,9 月份才开始量产。
所以真正的上手实测大家还得再等等,但是如果你还好奇昨天的发布会还公布了哪些细节,托尼这里可以带着大家再盘一下这两款国产自研显卡昨天公开的信息。
首先是这两款显卡核心的 GPU 部分,基于台积电 N6 工艺,并且采用了 “ 砺算科技 ” 自研的 TrueGPU 图形架构。这也意味着从计算核心到指令集完全由自主设计,而不是市场上常见的 “ 公版 IP 授权 + 自主优化 ” 的形式。
这样做有啥好处呢?举几个发布会录播提到的例子吧 ——
我们都知道,GPU 的 3D 渲染,也就是我们看到的图形,是根据无数的三角形像积木一样拼凑出来的。GPU 的渲染过程,就是三角形的拆分、拼凑和后续计算的过程。
根据砺算科技官方的说法,砺算 7G106 的三角形渲染,重构了图形管线的执行逻辑,智能乱序渲染,而且能根据负载情况动态分配计算单元。不用像传统的 GPU 图形一样,按照既定的步骤,低效地一步步执行,所以砺算 7G106 能够在适配场景下直接提升 50% 的渲染效率。
此外,砺算 7G106 还支持 FP32 或 INT32 的指令双发射,以方块形式存储矩阵数据等特性,可以优化 40% 的显存使用效率。
从这些支持特性上来看,砺算显卡的设计思路还是比较先进的 ——
就拿 FP32/INT32 双发射这点来说,我查了一下,NVIDIA 也是从 20 系显卡才开始支持,AMD 则是从前两年的 RX7000 系显卡才开始支持,英特尔则是从 A700 系列的独显才开始支持。
说完 GPU,接下来再来看下两款显卡的硬件规格:
根据发布会录播,消费级显卡砺算 7G106 搭载 12GB GDDR6 显存,但是功耗频率这样的基础硬件信息并未公布;参考同行爆料的信息,砺算 7G106 位宽 192bit,拥有 192 个纹理单元(TMU)和 96 个光栅单元(ROP)。
假设这个爆料属实,那么砺算 7G106 就是拥有 4060 两倍规模的纹理单元和光栅单元,那么它在跑分上超过 4060,好像就说得过去了。除此之外,砺算 7G106 支持 DirectX 12、Vulkan 1.3、OpenGL 4.6 和 OpenCL 3.0 等主流 API,大概是个够用但并不算进阶的水平。
因为目前 DX 12 API 最新的版本是 DX12 Ultimate,Vulkan 最新版本是 1.4。缺乏这两个 API 最新版本的支持,就意味着砺算 7G106 有可能不支持光追和可变速率着色(VRS),影响游戏时画面效果和帧率,并且在渲染能力上存在一定的劣势。
可变速率着色(VRS)示意,从左到右着色率变低
反观砺算想要挑战的行业霸主英伟达这边,先是在 2014 年发布的 GTX 900 系列显卡上支持了瓦片式渲染和改进的调度器,这两样技术其实也属于砺算这次宣传的 “ 智能乱序渲染 ” 的类似物。
但是英伟达直到 4 年后的 RTX20 系列才支持可变速率着色(VRS),然后才支持了完整的 DX12 Ultimate API,砺算 7G106 的后续产品,明显还有一些需要提升的地方。
其他方面,砺算 7G106 采用 PCIe 4.0 x16 标准,提供 4 个 DisplayPort 1.4 接口,公版卡没有 HDMI 接口。
顺带说一下专业卡 7G105 的规格,整体来看处于中高端的水平 ——
配备 24GB GDDR6 ECC 显存、最大纹理填充率 384GT / s,最大像素填充率 192GP / s,支持 FP32 和 INT8 计算,FP32 最大吞吐量为 24 TFLOPS,也适合高像素渲染以及大模型训练。
前面架构和规格的部分,目前能公开找到的资料其实不多,但我相信参数啥的大家也就随便看看,游戏党们更关心的还是具体的实测 ——
之前也提到了,砺算 7G106 的部分光栅性能是强于 RTX 4060 的。。。
比如在 Geekbench 测试里,衡量 GPU 通用计算能力的 OpenCL 跑分,砺算 7G106 得分为 111290 分,比 RTX 4060 的 101028 分,整整高出 10%,甚至直逼 RTX 5060!如果上市的时候再搭配不错的价格,感觉花更少的钱就能买到光栅性能这块,就不止是 AMD 一家的优势了。
更贴近游戏性能的 3DMark Fire Strike( 1080p )测试,砺算 7G106 的跑分成绩为 26800 分,作为对比 4060 大约是2w7 到 2w8 的成绩,也几乎快追上 4060 了。
在更考验显卡性能的 4K 分辨率测试项目 Steel Nomad 里,砺算 7G106 的跑分也能有 2256 分,参考公开的测试数据,RTX 4060 这项测试的数据在 2302 左右。
总结下来,砺算 7G106 显卡的整体表现,虽然说不至于完全对标英伟达 RTX 4060,但光栅化性能是妥妥的赶上了,然后在一些小项目上体现出了自己的优势。
但是我们都知道,老黄除了硬件还有软件,就拿游戏来说,DLSS 是老黄的招牌。
根据发布会录播的来看,砺算也做了个名叫 NRSS 的 DLSS 类似物,但是没有实机演示;我在录播里看到,最后发布会现场是拿黑神话内置的游戏科学 NXSR 做了个超分的演示,也就是通过原生低画质 + 超采样实现 4K 分辨率运行黑神话悟空,但是对一款甜品卡来说,咱们直接看 1080P 的表现就好了。
《黑神话:悟空》在 1080P 分辨率、高画质设置下,砺算 7G106平均帧数能过 70 帧,而且在打斗过程中,遇到野怪、释放技能和特效,也没有明显的掉帧情况。这个表现,其实跟 4060 关掉 DLSS “裸玩” 黑猴的帧数也差不多了(虽然没这个必要)。。。
更让托尼感觉到意外的是,明末:渊虚之羽在1080P 分辨率、高画质设置下,依旧能跑到 70 帧以上。参考同行针对这个游戏做的实测,RTX 5060显卡在 DLSS4 多帧生成的条件下,可以达到 149 帧,但会感觉到明显卡顿。
考虑到这是个上线还没有两天的游戏,这么短的时间,砺算 7G106 肯定来不及针对游戏做适配,就能达到这种可玩的水平,那只能理解为砺算 7G106 核心规模更大,以及大显存、高位宽,带来的力大砖飞的提升了。
至于老牌的 3A 游戏古墓丽影:暗影,砺算 7G106 在游戏时只有平均 80 帧以上,表现就要差一些了。在同样的画质设置下,4060 对这款游戏有适配优化,可以跑到 147 帧。这其实也是摆在国产 GPU 面前的最大的问题,硬件追赶只是第一步,后续的驱动适配和游戏优化,路还长着呢。。。
如果托尼后续能够拿到这款显卡,到时候也会给大家来个全面测试。
感觉砺算 7G106 未来随着驱动的优化,整体达到 4060 的水平应该没有什么问题,而且游戏玩家们其实很包容国产显卡的,哪怕最后的实际表现不如 4060,或者说用着真有 bug,只要价格别割韭菜,愿意和国内玩家们交朋友,那我相信,大家都是陪着你一起成长的。
我们不妨对比另外一个国产显卡摩尔线程 S80——
一开始大家也吐槽摩尔线程的 S80 显卡很多游戏都玩不了,缺乏优化,但是后来它就降价了,有一阵的优惠价格甚至掉到了 1000 块钱左右,之后各路评论区对摩尔线程的评价一下子就反转了,变成了 “只有中国人真心对中国人好”。。。
所以问题来了,大家觉得这次砺算的显卡会卖多少钱呢?
撰文:Levi
编辑:米罗 & 洛洛
美编:阳光
图片、资料来源:
砺算科技发布会
b站@憨色的手脚
游民星空@MadaoKing
知乎@Wallcae