NVIDIA RTX 3060 Ti显卡怎么样 NVIDIA RTX 3060 Ti详细评测
大家都知道,全新的RTX 30系显卡截至目前已经解禁了RTX 3070/3080/3090三款显卡,今天要给大家带来的则是NVIDIA GeForce RTX 3060 Ti的评测,感兴趣的朋友不要错过了。
对于这款显卡突然出现相信大家和笔者一样,非常迷惑。“60 Ti”这个型号自常规系列的GTX 760 Ti之后就没有出现过(16系显卡除外),可以说近两年的甜品显卡“Ti”这个后缀非常罕见,而且如果出现Ti作为后缀的情况,按照以往的惯例也应该是先发布旗舰产品,如GeForce RTX 2080 Ti,所以本文我们也来研究研究这款RTX 3060 Ti有何过人之处。
GeForce RTX 3060 Ti显卡背板
目前这款GeForce RTX 3060 Ti的售价为2999元起,与上一代的RTX 2060 SUPER售价相同,但性能相差悬殊,这在下面的测试中也会有所体现。
作为一款甜品级显卡,以往系列的定位大致在1080P至2K分辨率之间,也就是说在3A游戏中2K分辨率下基本可以流畅运行,想要体验更高帧率,1080P分辨率是最好选择。不过采用NVIDIA Ampere架构的30系显卡自然不会如此“平庸”,下面就让我们进入评测正题,先来看看外观。
另外播报一则福利,欢迎大家在首测文章下面踊跃评论(不限定评论内容),我们将会在评论中抽取8名小伙伴送出WD_BLACK定制腰包。
抽奖方式:本次活动采用楼层抽取的方式,分别为8楼/18楼/28楼/38楼/48楼/58楼/68楼/78楼,中奖用户我们将通过站内私信的方式与您取得联系。
同一个ID仅限获奖一次,二次中奖将顺延至下一位
同一个ID最多回帖3次,超过3次取消中奖资格,顺延至下一位获奖
01 GeForce RTX 3060 Ti外观
在外包装上,GeForce RTX 3060 Ti与前几款发布的显卡相同,NV标识性的极简风格,方方正正的硬纸盒子,主色调以黑色为主,辅以玫瑰金色纹路。
GeForce RTX 3060 Ti
GeForce RTX 3060 Ti显卡外观
RTX 3060 Ti的整体外观相较RTX 3070的差别不大,相比RTX 3080/3090要小巧不少,长宽比给人非常舒服的感觉。在之前的评测中我们讲过RTX 3080采用了一前一后的风扇散热设计,显卡尾部的风扇主动将热气排至上方再由整体的散热系统排出。而RTX 3060 Ti与RTX 3070则是采用了传统的双风扇设计。
GeForce RTX 3060 Ti
GeForce RTX 3060 Ti背板散热鳍片
相比RTX 3080的推拉式散热,RTX 3060 Ti采用推式风扇设计,显卡前端的风扇将热空气从机箱背部支架排出;显卡尾部直接由正面导流罩和大量的外露散热鳍片组成,形成中空状态,风扇依旧会将热气通过散热鳍片向上排出。
GeForce RTX 3060 Ti侧边
GeForce RTX 3060 Ti供电转接线
除此之外的一些细节部分,侧面的GeForce RTX logo取消了LED灯,改为喷涂印刷。供电接口还是熟悉的单12pin,不过转接线采用了12pin转单8pin。所以对于大部分玩家来说,意味着可以不用大动干戈换电源,直接升级显卡。另外RTX 3060 Ti的边框颜色相比RTX 3070颜色更浅,呈现亮银色。
GeForce RTX 3060 Ti 视频输出接口
在视频输出接口上,RTX 3060 Ti采用DP1.4*3+HDMI 2.1的4接口设计,同样新的HDMI 2.1协议可支持单线8K的视频输出。
02 NVIDIA Ampere架构中的RTX 3060 Ti
NVIDIA GeForce RTX 3060 Ti采用了NVIDIA Ampere架构,我们首先来看一下RTX 3060 Ti的提升。
第一代RTX架构 Turing下的2060 SUPER
第二代RTX架构 Ampere下的3060 Ti
相较于初代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,这一点在RTX 3060 Ti中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3060 Ti的着色器性能达到16.2 TFLOPS单精度性能,而Turing为7.2 TFLOPS。
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到31.6 RT TFLOPS,而Turing为21.7 RT TFLOPS。
全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达129.6 Tensor TFLOPS,而Turing为57.4 Tensor TFLOPS。
NVIDIA GeForce RTX 3060 Ti采用GA104核心拥有174亿个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,另外在RTX 3060 Ti中我们都知道仍然采用了GDDR6显存,不过不同于RTX 3080的Micron,RTX 3060 Ti采用了三星的GDDR6显存。
我们在发布会中经常听到性能翻倍的说法,其实是因为本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这就使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
RTX 3060 Ti共有4864个CUDA,其实它有2432个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了4864这个惊人的数字。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
光追工作原理示意
在此次的NVIDIA Ampere架构中,NVIDIA官方宣布为第二代RT Core,它和第一代有什么不同呢。首先要知道RT Core的工作原理是,着色器发出光线追踪的请求,交给RT Core来处理,它将进行两种测试,分别为边界交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersection testing)。基于BVH算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。
而光线追踪最耗时的正是求交计算,因此,要提升光线追踪性能,主要是对两种求交(BVH/三角形求交)进行加速。
RT Core的变化
在Turing的RT Core中,可以每个周期完成5次BVH遍历、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能。
运动模糊渲染原理
第二代RT Core可以让光线追踪与着色同时进行,进行的光线追踪越多,加速就越快,它将光线相交的处理性能提升了一倍,在渲染有动态模糊的影像时,按照NVIDIA自己的实测,比Turing快8倍。
稀疏深度学习
Tensor Core可以看作是GeForce RTX GPU上的AI大脑。可加速用于深度神经网络处理功能的线性代数,这是现代AI的基础。例如用于AI超分辨率的NVIDIA DLSS和用于AI增强的声画处理技术NVIDIA Broadcast应用。
在本次的NVIDIA Ampere架构的Tensor Core也得到了极大地加强,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。
首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高Tensor Core的性能。
与此次RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。
传统的数据交换
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。
RTX IO可以极大解放CPU负担
当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。
同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。
03 3DMARK 理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥RTX 3060 Ti显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,RTX 3060 Ti目前的核心代号在软件上还未知,不过三星8nm是肯定的了,芯片面积未知,拥有4864个CUDA,频率为1410-1665MHz,采用8GB GDDR6显存,位宽为256bit,显存带宽达到了448GB/s,光栅单元和纹理单元虽然软件显示为80和405,但显然纹理单元的数据有些错误。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
相关文章
影驰RTX 3090 GAMER OC显卡怎么样 影驰RTX 3090 GAMER OC显卡评测
今天笔者将给大家带来一款出自影驰之手的GeForce RTX 3090 GAMER OC显卡评测,这款显卡在外观设计上可以用穿越经典来形容,与我们传统所认知的显卡设计与众不同,影驰开发2020-11-28- 昨晚,RX 6800、RX 6800 XT首发开售,售价分别为4599元、5099元,那么这款显卡的内部构造如何?有哪些亮点?下面我们就来看看AMDRX6800拆解图,需要的朋友可以参考下2020-11-19
AMD RX 6800/6800 XT显卡怎么样 AMD RX 6800/6800 XT详细评测
AMD举行线上发布会,发布了RX 6800/6800 XT/6900 XT 共3款显卡。本次性能解禁的为RX 6800和RX 6800 XT两款显卡,两款产品的公版售价分别为4599元和5099元,一起看看吧2020-11-19索泰RTX3070 X-GAMING OC值得入手吗 索泰RTX3070 X-GAMING OC显卡评测
索泰RTX3070 X-GAMING OC怎么样?性能如何?好不好用?值得买吗?下面小编带来索泰RTX3070 X-GAMING OC显卡评测2020-11-18华硕ROG STRIX RTX3070怎么样 华硕ROG STRIX RTX3070显卡评测
华硕ROG STRIX RTX3070怎么样?性能如何?值得入手吗?下面小编带来华硕ROG STRIX RTX3070显卡评测2020-11-17索泰RTX 3070 X-GAMING OC怎么样 索泰RTX 3070 X-GAMING OC详细评测
旗舰RTX 3080真香,因为它近乎翻倍的性能提升,中端RTX 3070真香,因为它极具标志性的性价比。今天我们为大家带来的评测为索泰GeForce RTX 3070 X-GAMING OC显卡,一起看看2020-11-09耕升RTX 3070 炫光显卡怎么样 耕升RTX 3070 炫光显卡全面评测
我们本次评测的产品为耕升GeForce RTX 3070 炫光OC显卡,在众多厂商中耕升虽算不上一线豪门,但也有自己的制胜法宝,一起看看吧2020-11-04影驰RTX 3070 GAMER OC显卡怎么样 影驰RTX 3070 GAMER OC详细评测
随着NVIDIA GeForce RTX 3070的性能解禁,越来越多的厂商推出了自己不同系列的产品,此前我们为影驰进行过GeForce RTX 3080黑将的评测,今天为大家带来的是影驰GeForce RTX2020-11-03iGame RTX3070显卡怎么样 iGame RTX3070 Advanced OC显卡全面评测
iGame RTX3070显卡怎么样?性能如何?玩游戏卡不卡?值得入手吗?下面小编带来iGame RTX3070 Advanced OC显卡全面评测2020-11-02耕升RTX 3090炫光显卡怎么样 耕升RTX 3090炫光显卡全面评测
RTX 3090显卡能够为用户实现畅玩8K的游戏体验以及更有效率的内容创作表现,当然如果你把RTX 3090显卡用来打游戏的话并不能发挥这款显卡全部的实力,内容创作领域才能解锁这2020-10-30
最新评论