索泰RTX 3060 Ti X-GAMING OC怎么样 索泰RTX 3060 Ti X-GAMING OC评测

中关村在线   发布时间:2020-12-17 09:30:25   作者:曲楠   我要评论
30系显卡有着非常恐怖的性能飞跃,即使是RTX 3060 Ti这种甜品级显卡的性能都在RTX 2080 SUPER,也就是上一代的准旗舰之上。今天为大家带来的是索泰RTX 3060 Ti X-GAMING OC的评测,一起看看吧

转眼2020年已经接近尾声了,持续了将近一个季度的“显卡发布季”随着60型号的发布暂时告一段落,接下来A/N两家将着重更新移动游戏卡。整体来看30系显卡有着非常恐怖的性能飞跃,即使是RTX 3060 Ti这种甜品级显卡的性能都在RTX 2080 SUPER,也就是上一代的准旗舰之上。今天为大家带来的是索泰RTX 3060 Ti X-GAMING OC的评测,感兴趣的朋友不要错过了。

索泰RTX 3060 Ti X-GAMING OC采用了NVIDIA Ampere架构,相较于上一代的NVIDIA Turing架构有什么不同呢?

NVIDIA 3060 Ti首测

第一代RTX架构 Turing下的RTX 2060 SUPER

NVIDIA 3060 Ti首测

第二代RTX架构 Ampere下的RTX 3060 Ti

相较于初代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,这一点在RTX 3060 Ti中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3060 Ti的着色器性能达到16.2 TFLOPS单精度性能,而Turing为7.2 TFLOPS。

NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到31.6 RT TFLOPS,而Turing为21.7 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。

例如最新发布的《赛博朋克2077》中,当玩家在游戏中遭遇赛车,追逐,打斗等激烈运动场景,第二代光追在架构上可以确保显卡渲染帧率相对更平稳,游戏体验上不会有频繁掉帧带来的顿挫感。

索泰3060ti评测

《赛博朋克2077》

全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达129.6 Tensor TFLOPS,而Turing为57.4 Tensor TFLOPS。

芯片虽然决定了显卡的性能和规格,但是显卡工作的整体稳定性,温度表现,噪音等级却更依赖显卡制造商在PCB布线,电子元器件的适配,散热系统调校等综合能力。

在评测开始前,笔者为大家总结一些该显卡的特点,也方便大家有针对性的阅读:

粉蓝撞色外观,更加年轻活泼

超强性价比

满载64℃出色的散热设计

总的来说,索泰RTX 3060 Ti X-GAMING OC相比公版在散热方面做了很大改善,在整个RTX 30系显卡中拷机满载64℃也是少有的,作为老牌的AIC核心厂商,显卡素质让人绝对放心。同时全新的X-GAMING系列撞色设计赋予了显卡更年轻活泼的感觉。对于大部分玩家来说RTX 3060 Ti完全可以满足2K流畅的游戏体验,高性能低功耗的特点也让用户在升级显卡时不必大动干戈来更换电源。

01 索泰RTX 3060 Ti X-GAMING OC外观

在RTX 30系显卡中,索泰的X-GAMING系列外观全面改版,采用了年轻时尚的撞色设计。两种颜色的搭配堪称绝妙,不同色系的撞色搭配,不仅不会有违和感,两种色彩混合在一起还能给人清新时尚的感觉。

索泰3060ti评测

索泰RTX 3060 Ti X-GAMING OC

索泰RTX 3060 Ti X-GAMING OC采用了粉蓝撞色设计,整体外观一改以往的冰冷金属风格,多了许多活泼元素,同时表面涂装略带磨砂质感,所以触手感觉也比较温和。

显卡的整体尺寸为331×118×53mm,相较上一代显卡没有明显增加,最主要的是厚度相较目前的非公版显卡控制的比较好。正面采用3个11叶盾鳞风扇,搭配智能启停设计,有效提升散热气流的流动效率,同时也更静音,延长风扇寿命。

索泰3060ti评测

索泰RTX 3060 Ti X-GAMING OC供电接口

在显卡顶部,有倾斜的ZOTAC logo设计,相比以往的灯效来说,呈现的方式也更加活泼年轻化。索泰RTX 3060 Ti X-GAMING OC的供电接口位于logo灯上方,采用单8pin供电,由于这款显卡的自身功耗较小,实测满载仅为200W左右,对于想换新显卡又不想换电源的用户非常友好,推荐的电源为650W及以上。

索泰3060ti评测

索泰RTX 3060 Ti X-GAMING OC背板

索泰RTX 3060 Ti X-GAMING OC的显卡采用铝合金背板,增强散热的同时,保护PCB不会弯折变形。并且同样采用粉蓝撞色设计,尾部印有白色的“X-GAMING”logo字样,中间镂空部位方便芯片散热。

索泰3060ti评测

索泰RTX 3060 Ti X-GAMING OC

在显卡内部散热方面,采用了3热管+镜面抛光工艺接触传导,让散热模组与GPU之间的贴合更紧密,导热更高效,散热更迅速。

索泰3060ti评测

索泰RTX 3060 Ti X-GAMING OC视频输出接口

视频输出接口上,索泰RTX 3060 Ti X-GAMING OC采用DP1.4a*3+HDMI 2.1的4接口设计,另外新的HDMI 2.1接口可支持单线8K的视频输出。

索泰3060ti评测

索泰RTX 3060 Ti X-GAMING OC

索泰RTX 3060 Ti X-GAMING OC的整体外观就为大家介绍到这里,下面我们来看看在新的NVIDIA Ampere架构下的RTX 3060 Ti是什么样的。

02 NVIDIA Ampere架构下的RTX 3060 Ti

索泰RTX 3060 Ti X-GAMING OC采用了NVIDIA Ampere架构,我们首先来看一下RTX 3060 Ti的提升。

NVIDIA RTX 3070首测 比肩RTX 2080Ti

RTX 3060 Ti采用GA104核心拥有174亿个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,另外在RTX 3060 Ti中我们都知道仍然采用了GDDR6显存,不过不同于RTX 3080的Micron,RTX 3060 Ti采用了三星的GDDR6显存。

我们在发布会中经常听到性能翻倍的说法,其实是因为本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这就使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。

而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。

RTX 3060 Ti共有4864个CUDA,其实它有2432个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了4864这个惊人的数字。

而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。

双倍加量不加价 NVIDIA RTX 3080显卡首测

光追工作原理示意

在此次的NVIDIA Ampere架构中,NVIDIA官方宣布为第二代RT Core,它和第一代有什么不同呢。首先要知道RT Core的工作原理是,着色器发出光线追踪的请求,交给RT Core来处理,它将进行两种测试,分别为边界交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersection testing)。基于BVH算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。

而光线追踪最耗时的正是求交计算,因此,要提升光线追踪性能,主要是对两种求交(BVH/三角形求交)进行加速。

双倍加量不加价 NVIDIA RTX 3080显卡首测

RT Core的变化

在Turing的RT Core中,可以每个周期完成5次BVH遍历、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能。

双倍加量不加价 NVIDIA RTX 3080显卡首测

运动模糊渲染原理

第二代RT Core可以让光线追踪与着色同时进行,进行的光线追踪越多,加速就越快,它将光线相交的处理性能提升了一倍,在渲染有动态模糊的影像时,按照NVIDIA自己的实测,比Turing快8倍。

双倍加量不加价 NVIDIA RTX 3080显卡首测

稀疏深度学习

Tensor Core可以看作是GeForce RTX GPU上的AI大脑。可加速用于深度神经网络处理功能的线性代数,这是现代AI的基础。例如用于AI超分辨率的NVIDIA DLSS和用于AI增强的声画处理技术NVIDIA Broadcast应用。

在本次的NVIDIA Ampere架构的Tensor Core也得到了极大地加强,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。

首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高Tensor Core的性能。

与此次RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。

虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。

双倍加量不加价 NVIDIA RTX 3080显卡首测

传统的数据交换

在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。

双倍加量不加价 NVIDIA RTX 3080显卡首测

RTX IO可以极大解放CPU负担

当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。

同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。

03 3DMARK 理论性能测试

首先介绍一下测试平台,为了保证此次评测能够发挥索泰RTX 3060 Ti X-GAMING OC显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。

索泰3060ti评测

在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。

索泰3060ti评测

GPU-Z参数

首先看一下GPU-Z的参数,RTX 3060 Ti采用GA104核心,三星8nm工艺,芯片面积392平方毫米,拥有4864个CUDA,索泰RTX 3060 Ti X-GAMING OC的Boost频率为1680MHz,公版为1665MHz,有小幅提升。采用8GB GDDR6显存,位宽为256bit,显存带宽达到了448GB/s,光栅单元和纹理单元为80和152。

下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

索泰3060ti评测

3D MARK FS套装测试

在针对显卡DX11性能的3DMARK FS套装测试中,我们主要对比索泰RTX 3060 Ti X-GAMING OC和RTX 2080 SUPER,整体来看在各项成绩中均小幅领先RTX 2080 SUPER;但差距不大。

相关文章

最新评论