性能直追4070Ti 技嘉非公版RTX 4070 SUPER魔鹰显卡评测
NVIDIA在今年的CES2024上发布了新一代的“SUPER“系列显卡,将在RTX 40系列中增设三款后缀SUPER的型号,分别是RTX 4070 SUPER、RTX 4070Ti SUPER和RTX 4080 SUPER。自RTX 20系之后SUPER显卡重现江湖,它势必代表比原版型号更激进的性能,但始发售价却不一定会高多少。
其中RTX 4070 SUPER将于1月17日首先和广大游戏玩家们见面,成为NVIDIA在2024年发布的第一款新游戏显卡。
和RTX 20系中第一次出现的SUPER显卡一样,这次的SUPER系列同样是在原有显卡系列的基础上,性能显著升级,而价格几乎保持不变。在世界普遍通胀,显卡价格高企的今天,这属实是不可多得的福利,让广大游戏玩家们能够享受到更具性价比的游戏显卡产品,印证了该系列的英文含义——SUPER超能力。
RTX 4070 SUPER相比RTX 4060有哪些变化?
RTX 4070 SUPER显卡所采用的AD104-350核心拥有5个GPC,和完整的AD104-400核心相比只缩减了2个TPC,在规格参数上显然更接近RTX 4070Ti显卡,这意味着玩家只要花费RTX 4070显卡的钱就能买到接近RTX 4070Ti的性能,可见这次NVIDIA的满满诚意。
RTX 4070 SUPER所使用的AD104-350核心架构
Ada LoveLace架构的SM流式多处理器微架构
按照Ada Lovelace架构的每个SM流式多处理器里包含了64个FP32单元和64个FP32/INT32混合单元,可视作为128个FP32单元,因而每个SM内为128个CUDA;按照每个SM配置了4个纹理单元、1个RT单元、4个Tensor core来计算,RTX 4070 SUPER一共拥有28组TPC、56个SM簇,共计7168个流处理器单元,224个纹理单元,56个三代RT单元和224个Tensor core。
按以上纸面数据计算RTX 4070 SUPER的性能预期可以达到RTX 4070Ti的93.3%,NVIDIA官方参数表呈现如下:
这次我们将以技嘉提供的RTX 4070 SUPER GAMING 魔鹰OC 12G显卡(下文简称RTX 4070 SUPER 魔鹰)为例,来为大家展示RTX 4070 SUPER显卡的真实性能表现,以及能为玩家们带来怎样的游戏性能体验。测试将包括常规的游戏测试以及时下应用越发广泛的AI创作测试。
RTX显卡的价值不止眷顾游戏玩家
自基于Volta架构的TITAN V开始,NVIDIA就算正式开始了在AI计算领域的布局,具体表现在首次集成在GPU内核中的张量计算单元——Tensor。专用于半精度、乃至四分之一精度海量并行计算能力的Tensor Core就是为AI量身打造的利器,无论是在游戏应用领域的还是AI创作领域,Tensor Core都是支撑其运行的核心硬件基础。
对于游戏玩家而言,和其它RTX 40系列显卡一样,DLSS 3/DLSS 3.5依然是RTX 4070 SUPER显卡的核心卖点,包含超分辨率、帧生成技术、光线重建和NVIDIA Reflex。
DLSS3专属的Freme Generation(帧生成技术)可以将光流预估和DLSS相结合,在现有帧之间插入精确的合成帧,由较少的原始像素渲染量输出成倍的帧画面,实现帧数“翻倍”提升,让玩家获得更流畅的游戏体验。
而DLSS 3.5则引入的Ray Reconstruction(光线重建)是专为“光线”开发的一套AI模型,它将需要人工设计的降噪器,替换为NVIDIA超级计算机训练的AI网络,通过高达原来5倍的训练量,使采样光线之间生成更高质量的像素,获得更贴近真实的光影视觉体验。
鱼和熊掌兼得的好事谁不喜爱?游戏开发者通过DLSS可以保证游戏质量还能降低配置需求,于是NVIDIA迅速建立起围绕DLSS的游戏生态,越来越多的新老游戏加入了阵营。
目前已有超过300款游戏和应用支持DLSS技术,而且数量还在持续不断的增加,这也将会成为玩家选购RTX 4070 SUPER显卡的重要理由之一。
对于RTX显卡的需求不再仅限于游戏用户
花开两朵各表一枝,另一方面,既然Tensor core可以即时优化处理游戏里的每一帧画面,那么给它更多时间,更多资源,它就可以生成更复杂的图像。如今以Stable Diffusion为代表的AI绘图技术正得到广泛应用,NVIDIA专为生成式AI在GPU上的高性能推理、训练而推出了TensorRT For Windows的SDK,让广大普通用户可以轻易使用GeForce RTX显卡为AI加速。调用NVIDIA GPU中的Tensor core,在数秒钟内生成想要的图像,亦可通过优化模型进度,提高推理吞吐量极大提高创作者的效率。
技嘉RTX 4070 SUPER魔鹰外观与规格参数
技嘉RTX 4070 SUPER 魔鹰 显卡采用了超公版的三风扇散热设计,显卡长度为30cm,高13cm,厚度约6.2cm,占用3条PCIe槽位。
技嘉RTX 4070 SUPER 魔鹰 显卡采用了自家经典的风之力散热系统,配置了3个9cm直径的导流风扇,正反设计可以防止风扇之间的扰流现象,减少风扇噪音的同时能够让气流更加集中,提高散热效率。
显卡配置了名为RGB幻彩光轮的灯效设计,在散热风扇的转轴和风扇外环上都安装了RGB灯,默认模式下会随着风扇转动而闪烁亮起,当待机或者风扇停止转动时灭灯,可以起到提示显卡负载状态的效果,也让用户能够在待机状态下暂时告别RGB光污染,玩家也可以通过技嘉智能管家(GCC)APP手动设置其它灯光效果或者和其它设备进行灯光同步。
外接供电接口背面有一个供电指示灯,供电正常状态下不亮,供电异常时会不停闪烁,而灯未接供电时会常亮。
外接供电接口旁边还有一个BIOS切换开关,分为OC和SILENT(静音)两个选项,不过经小编实际验证,技嘉RTX 4070 SUPER 魔鹰的2套BIOS设置完全一样,并没有任何频率、风扇策略的差异。
背面是一块全尺寸规格的合金背板,能为PCB提供全面保护,尾部采用了吹透设计,露出大块散热鳍片,可以让散热风扇产生的气流直接穿过散热鳍片,进一步提高显卡的整体散热效率。
IO接口方面配置了3个DP1.4a和1个HDMI2.1视频输出接口,可以满足不同玩家的显示设备连接需求,也方便用户组建多屏显示平台。
上面提到,技嘉RTX 4070 SUPER魔鹰虽然采用了OC、SILENT双BIOS设计,但实际上两套BIOS并没有任何区别,核心频率设置都是1980/2565MHz。相比公版技嘉魔鹰的Boost频率高出了90MHz,驱动写入功耗虽然和公版一致都是220W,但最大功耗值却达到了320W,整整高出了100W,这意味着技嘉RTX 4070 SUPER魔鹰显卡在超重负载下可有较小的降频,和更稳定的性能发挥,也可能具有宽松的手动超频空间,留给硬核玩家挖掘显卡的超频潜力。
技嘉RTX 4070 SUPER魔鹰显卡拆解
技嘉RTX 4070 SUPER 魔鹰 显卡的PCB为短板,长度只有17.5cm,相比显卡外观短了近一半。
RTX 4070 SUPER显卡采用了AD104-350核心,周围排布了6颗来自美光的GDDR6X显存颗粒,单颗容量为2GB组成12GB的总容量,不过显存位宽依然只有192bit,这也限制了RTX 4070 SUPER显卡在超高清分辨率下的输出。
技嘉RTX 4070 SUPER 魔鹰显卡采用了7+3相数字供电设计,7相为GPU核心供电,并且为每个MOSFET都提供了过温保护设计,确保显卡能够持续稳定工作,给予玩家最强核心性能。
散热鳍片采用了分段式设计,由6根6mm直径的纯铜热管穿插连接,配合纯铜散热底座和下方的2根6mm纯铜U型热管,能够将GPU核心产生的热量迅速传递到散热鳍片的各个角落,满足显卡的高效散热需求,时刻保持显卡最佳工作温度环境。
测试平台软硬件介绍
本次测试选用8款游戏充分全面考察其性能,并且与它近邻的RTX 4070以及上一代接近型号RTX 3070显卡做对比。其中2款游戏支持最新的DLSS3.5,也就是光线重构,另外4款支持DLSS3,最后两款则分别支持DLSS2和不支持DLSS,尽可能覆盖各种玩家的各种应用范围。
测试平台软硬件配置如下:
本次首测采用Intel最新消费级旗舰处理器Core i9 14900K,主板则选用做工用料卓越的技嘉Z790 AORUS MASTER X来保驾护航,确保测试平台稳定高效,能准确评估出RTX 4070 SUPER显卡的性能。
Intel Core i9 14900K处理器
技嘉Z790 AORUS MASTER X是仅次于Extreme的准旗舰型号
3DMARK基准测试:DX11、DX12
技嘉RTX 4070 SUPER 魔鹰显卡在3DMark Speed Way测试中的显卡得分为5265。
技嘉RTX 4070 SUPER 魔鹰 显卡在3DMark Time Spy Extreme测试中的显卡得分为10292。
技嘉RTX 4070 SUPER 魔鹰 显卡在3DMark Time Spy测试中的显卡得分为21596。
技嘉RTX 4070 SUPER 魔鹰 显卡在3DMark Fire Strike Ultra测试中的显卡得分为12489。
技嘉RTX 4070 SUPER 魔鹰显卡在3DMark Fire Strike Extreme测试中的显卡得分为25902。
3DMARK基准测试光追与DLSS
技嘉RTX 4070 SUPER 魔鹰 显卡在3DMark Port Royal测试中的显卡得分为13412。
技嘉RTX 4070 SUPER 魔鹰显卡在3DMark DirectX光线追踪功能测试中的平均帧率为63.51FPS。
技嘉RTX 4070 SUPER 魔鹰显卡在3DMark的DLSS3测试中,关闭DLSS为28.69FPS,开启DLSS3为101.28FPS。
技嘉RTX 4070 SUPER 魔鹰显卡在3DMark的DLSS2测试中,关闭DLSS为61.67FPS,开启DLSS3为146.63FPS。
《赛博朋克2077》游戏实测
由于RTX 40系列显卡最具价值的优势就是新增了对DLSS3的支持,因此游戏测试环节我们选择6款支持DLSS3,并且其中两款还支持最新DLSS 3.5的游戏大作来进行游戏性能对比测试。
我们通过分别测试显卡开启DLSS3(RTX 40系列)、DLSS2(RTX 30系列),与关闭DLSS后的游戏性能,来看看RTX 4070 SUPER显卡比RTX 4070显卡能领先多少,与RTX 4070 Ti显卡有多少差距,DLSS3加持下的RTX 4070 SUPER能领先开启DLSS2的RTX 3070多少。
赛博朋克2077
DLSS3.5的光线重构的功效并不仅是提升一些帧率性能,它还能优化光影效果,解决以往光追机制下出现的一些失真现象,令整体视觉效果进一步贴近现实逻辑。
下面为《赛博朋克2077》DLSS3.5光线重建开和关的画质对比:
《赛博朋克2077》
《赛博朋克2077》
《赛博朋克2077》
《心灵杀手2》游戏实测
心灵杀手2
下面为《心灵杀手2》DLSS3.5光线重建开和关的画质对比:
《心灵杀手2》
《心灵杀手2》
《心灵杀手2》
通过开启DLSS光线重建(DLSS 3.5)与关闭DLSS光线重建(DLSS 3)的画面效果对比不难看出,在开启光线重建之后,总体来说游戏的图像变得更加清晰,细节更为丰富,同时重影更少,并且在光线条件发生剧烈变化时响应更快,整体游戏体验变得更加逼真,代入感更强。
《战锤40K:暗潮》游戏实测
战锤40K:暗潮
《瘟疫传说:安魂曲》游戏实测
瘟疫传说:安魂曲