影驰GEFORCE RTX 4070Ti SUPER 金属大师Plus OC显卡全面评测

  发布时间:2024-12-05 15:58:03   作者:佚名   我要评论
影驰上架了 GeForce RTX 4070Ti SUPER 金属大师 Plus OC 显卡,与之前 RTX 4070Ti SUPER 金属大师不同,这是一块 OC 还带 Plus 的版本,下面我们就来看看这款显卡的测评

在《黑神话·悟空》中,2K分辨率影视级画质下测试,关闭DLSS帧生成,测试成绩为平均帧率50帧/秒,最低38帧/秒,95%帧率高于42帧/秒。

保持2K分辨率影视级画质下测试,打开DLSS帧生成,测试成绩为平均帧率85帧/秒,最低69帧/秒,95%帧率高于74帧/秒。

2、《赛博朋克:2077》

在《赛博朋克:2077》中,2K分辨率光线追踪:超速画质下测试,关闭DLSS帧生成,测试成绩为平均帧率71.03fps,最低63.61fps。

同样在2K分辨率光线追踪:超速画质下测试,打开DLSS帧生成,测试成绩为平均帧率118.26fps,最低107.6fps。

3、《极限竞速:地平线5》

在极限竞速:地平线5中,使用2K分辨率极端画质测试,最终测试成绩为158fps。

4、《地平线:零之曙光》

在地平线:零之曙光中,使用2K分辨率和终极质量画质测试,最终测试成绩为194fps。

5、《古墓丽影:暗影》

在古墓丽影:暗影中,使用2K分辨率和最高画质测试,关闭DLSS,平均帧率220。

在古墓丽影:暗影中,使用2K分辨率和最高画质测试,打开DLSS,平均帧率272。

对比RTX 3080Ti显卡,可以看到老一些的游戏普遍都有20%左右的帧数性能提高,新游戏则由于支持DLSS3,性能提高非常显著。

《黑神话·悟空》开启DLSS超分辨率采样之后,3080Ti就无法打开帧生成功能,而《赛博朋克》使用3080Ti直接就无法启用DLSS。

相信随着支持DLSS3的游戏越来越多,RTX 3080Ti和影驰GEFORCE RTX 4070Ti SUPER 金属大师Plus OC显卡的差距只会越来越大。

五、AI和生产力性能测试:对比3080Ti全面提升超20%

1、UL Procyon

在本地侧端体验部分,我们使用UL Procyon作为基准测试,它支持对多种AI推理引擎和Stable Diffusion图像生成模型进行测试,并给出非常直观的结果,包含总分、总耗时、图片生成速度等数据、CPU和GPU型号以及跑分设置等信息。

其中AI Image Generation Benchmark套件,包含了2个不同版本的Stable Diffusion模型构建的测试,分别为SD1.5和SDXL,在兼容性上支持TensorRT、OpenVIVO、ONNX Runtime,也就是说支持主流的NVIDIA、Intel、AMD三大平台。

首先测试的是基于SD1.5(FP16)的AI Image Generation Benchmark,在这个过程中每批次会创建4幅图像,共16幅,分辨率为512×512,干预步骤为100。

影驰GEFORCE RTX 4070Ti SUPER 金属大师Plus OC显卡得分为3497,Stable Diffusion 1.5的UNET(神经网络架构)速度最高可达56.925it/s,平均只需1.787秒就能生成一张图像。

之后进行基于SDXL(FP16)的AI Image Generation Benchmark测试,在这个过程中每批次会生成1张图像,总共会创建16幅图像,分辨率提升到1024×1024,干预步骤为100。

影驰GEFORCE RTX 4070Ti SUPER 金属大师Plus OC显卡得分为3128,Stable Diffusion XL的UNET(神经网络架构)速度最高可达8.483it/s,平均只需11.987秒就能生成一张图像。

之后使用AI Computer Vision Benchmark中的NVIDIA TensorRT测试项目来测试AI推力性能,精度设置为float32。

NVIDIA TensorRT 是一款用于在 NVIDIA 硬件上实现高性能推理的 SDK。TensorRT 使用经过训练的网络,然后从中生成一个优化后的运行时引擎。此 SDK 包括一个优化程序,可使用 NVIDIA 的不同优化工具,在其执行运行时启用快速推理,充分利用了 Tensor Cores 等 NVIDIA 硬件的优势。

相关文章

最新评论