NVIDIA RTX3080值得入手吗 NVIDIA RTX3080显卡详细评测
二、安培构架解析:流处理器数量翻倍是否言过其实?
在图灵诞生之前,GPU核心中并没有单独的INT32单元,从Kepler到Maxwell到再到Pascal,每一个CUDA核心都就是由FP32单元构成。
而Turing每一个CUDA核心除了有一个FP32的单精度浮点单元之外,还有对应有一个INT32的单精度整数单元。
在现代游戏(例如古墓丽影:暗影)中,每100条指令操作中有62条是浮点指令操作,38条是整数指令操作。以往GPU在只能单独、交替的执行浮点和整数运算,图灵构架加入了整数运算单元之后,可以与浮点单元一起并发执行,可以将流处理器的执行效率提升36%。
不过在游戏中整数运算量远远低于浮点运算量(38:62),因此经常会有大量的INT32单元被闲置。为了解决这个问题,提升INT32单元的利用率,NVIDIA改进了INT32单元,使之不仅可以运行整数运算,也能进行单精度浮点运算。
如上图所示,在安培构架中,每个SM单元中的64个FP32单元依旧保留,而INT32单元则被赋予了更多的使命,它不仅能进行整数运算,但是在不需要进行整数运算的情况下,它也能和FP32一样进行单精度浮点运算。
也就是说,每个SM单元可以同时执行4x(16FP32+16FP32)=128个FP32运算,或者4x(16FP32+16INT32)=64个FP32+64个INT32运算。
在理想的情况将下,一个SM单元中的64个INT单元全部都做单精度浮点运算的话,那么流处理器(FP32单元)数量将会直接变成128个。相对而言,图灵构架一个SM单元只有固定的64个流处理器。
RTX 3080拥有68个SM单元,理论上能达到8704个流处理器的规模。很多同学可能怀疑NVIDIA在骗我们,这些流处理器是否能够同时工作还是个问号。
下面我们使用AIDA64 GPGPU进行验证,看看RTX 3080的8704个流处理器是否言过其实。
如果依据1710MHz的频率和8704个FP32单元来计算RTX 3080的理论浮点性能应当是29767GFLOPS。
实测RTX 3080的单精度浮点运算性能是29117GFLOPS,略低于理论值。这是因为320W TDP的限制,RTX 3080在进行GPGPU单精度浮点测试时,GPU核心的满载频率只有1672MHz并没有达到默频的1710MHz。
不过从这里可以看出,RTX 3080的的确确拥有8704个流处理器(FP32单元),现在已经没有什么好质疑的了。
实测RTX 2080 Ti的单精度浮点运算性能是16626GFLOPS,接近RTX 3080的6成。
实际上,在进行GPGPU测试时,RTX 2080 Ti的运行频率达到了1910MHz,所以虽然流处理器数量只有一半,但是浮点性能却能达到6成。
RTX 2080在进行GPGPU测试时,运行频率更是高达1938MHz,单精度浮点运算性能达到了11416GFLOPS,约为RTX 3080的40%。要知道RTX 2080 2944个流处理器只相当于RTX 3080 8704个流处理器的1/3。
所以现在大家应该知道了RTX 3080 TDP如此之高的原因!即便是320W的TDP,也难以满足让8704个流处理器以较高的频率运行的功耗需求。
相关文章
NVIDIA 30系显卡怎么样 NVIDIA 30系显卡发布会内容详解
NVIDIA这场发布会简短精悍节奏紧凑,满打满算不过40分钟,但NVIDIA CEO黄仁勋先生的每一句话都值得细细品味,乃至反复观看,一起看看吧2020-09-02英伟达 RTX 30 显卡值得入手吗 一文看懂英伟达 RTX 30 系显卡
英伟达 RTX 30 显卡值得入手吗?9月2日凌晨消息,英伟达在线上举行发布会,正式发布了GeForce RTX 30系显卡。下文中为大家带来了英伟达 RTX 30 系显卡详细介绍,感兴趣的朋2020-09-02win10 2004系统显卡驱动报错怎么办 显卡驱动报错的原因和解决方法
最近很多win10 2004系统的朋友遇到了不少的问题,最为常见的就是显卡驱动总是报错,那么是什么原因造成的显卡报错呢?又该如何解决win10 2004显卡驱动报错呢?还有不知道的2020-08-07影驰GTX 1650 Ultra骁将显卡怎么样 影驰GTX 1650 Ultra骁将评测
今天给大家带来的是带Ultra后缀的1650骁将显卡,这是一张入门甜品卡,一起看看吧2020-08-06蓝宝石RX570白金 4G版怎么样 蓝宝石RX570白金 4G版显卡介绍
蓝宝石RX 570 4G D5白金OC显卡采用了AMD全新14nm工艺的Polaris 20 XL核心,显卡的显存规格为4GB/256-Bit,核心频率为1244-1284MHz,搭载了2048个流处理器,一起看看吧2020-07-27七彩虹GeForce RTX+DLSS 2.0怎么样 七彩虹GeForce RTX+DLSS 2.0实测
为了全面了解GeForce RTX系列测试光线追踪及DLSS,我们使用4块七彩虹iGame的显卡进行全面测试,看看英伟达DLSS 2.0所带来的黑科技能够让玩家感到兴奋,同时满足光线追踪所2020-07-22AMD GPU RX-5300M显卡怎么样?AMD GPU RX-5300M显卡详细测试
外媒 Notebookcheck 现已发布了微星 Bravo 15 的评测,这款笔记本搭载了 R7 4800H 和 RX 5300M 显卡。一起来看一下这款 AMD 移动端入门级显卡表现如何吧2020-07-15迪兰RX 56XT X战神散热怎么样 迪兰RX 56XT X战神温度实测
我们今天主要测试的显卡为迪兰RX 5600 XT 6G X战神,说实话这张显卡在温度控制方面着实惊艳到我了,一起看看吧2020-07-10性能强大灯效炫目 七彩虹RTX 2080 SUPER显卡评测
最近,微软正式公布了DX12 Ultimate,新增对DXR 1.1光线追踪的支持,提高了光追游戏的性能,所以我就在上个月入手了七彩虹iGame GeForce RTX 2080 SUPER Vulcan X OC,一起2020-07-07畅玩光线追踪游戏 iGame RTX 2060 SUPER显卡评测
随着3A大作游戏的不断涌进,所带来极致光效的渲染画面也是让人为之惊叹,而七彩虹iGame GeForce RTX 2060 SUPER Vulcan X OC作为热卖的甜品级显卡之一,不仅外观炫彩华丽,2020-07-01
最新评论