Tesla P100怎么样?NVIDIA Tesla P100计算卡性能首发评测
Nvidia在之前的GTC大会上正式发布了全新一代的计算卡Tesla P100,这也是世界上首款采用Pascal架构的计算卡,那么对于这么一块计算卡来说,它的性能如何呢?下面就详情来看看相关评测吧!
GTX 1080/1070虽然性能很强悍,但它们在全新的帕斯卡家族中只能算是中档水准,真正的大杀器是顶级大核心GP100,拥有3840个FP32单精度、1920个FP64双精度CUDA核心,主要面向高性能计算领域。
担任首发的Tesla P100(似乎也叫Tesla P1),只开启了3584个单精度、1792个双精度核心,即便如此单、双精度浮点性能也高达10.6TFlops、5.3TFlops,同时还搭配了4096-bit 16GB HBM2高带宽显存,并支持全新的NVLink互连总线,取代传统PCI-E。
那么它到底性能如何呢?圣地亚哥超级计算中心的Scott Le GrandRoss Walker、亚马逊网络服务的Scott Le Grand联合编写了一个通用计算测试工具AMBER,可模拟生物分子周围的力场,并与NVIDIA合作对Tesla P100进行了一番测试,包括单路、双路、四路。
由于测试所用硬件还是工程样品,操作系统是Linux,而且测试工具和测试方法是专门为了考察纯粹计算性能而设计的,所以结果反映的只是纯计算能力,和游戏表现无关。
事实上,GP100核心应该永远不会出现在消费级领域,GTX 1080 Ti、GTX Titan X 2之类的顶级卡会使用GP102。
参与对比的产品中,Tesla M40基于麦克斯韦架构大核心GM200,3072个流处理器,单精度性能突破7TFlops,双精度只有0.21TFlops,搭配384-bit 12GB GDDR5显存。
Tesla K80使用的是两个开普勒架构大核心GK210,4992个流处理器,单双精度浮点性能8.74、2.91TFlops,搭配两组384-bit 12GB GDDR5。
Tesla K40的核心是GK110,2880个流处理器,单双精度浮点性能4.29、1.43TFlops,搭配384-bit 12GB GDDR5。
GTX 1080、Titan X、980 Ti、980也都加入了对比,另外还有几颗纯CPU,包括双路的E5-2697 v4/2698 v3/2650 v3,分别有32/32/20个核心。
具体测试原理、流程啥的就不多说了,专业性太强,只简单看看结果:
相比于前辈M40,P100的计算性能提升相当猛,绝大部分项目都在50%左右,少数甚至超过80%,有的甚至接近100%!
事实上在大部分时候,单路P100都能干掉双路M40,领先幅度10-20%不等。
对比消费级游戏卡,P100单路已经相当于GTX Titan X四路的水准,也可以看到GTX 1080同样十分凶猛,多数情况下都达到或者接近M40的水平,但不够稳定,有时候相当于单块Titan X,有时候超过人家两块。
最遗憾的是,NV-Link总线的威力还没有发挥出来,双路、四路P100的提升幅度普遍还不如PCI-E。
八路Tesla P100
综上的就是脚本之家汇总的关于NVIDIA Tesla P100计算卡性能首发评测,大家可以参考学习一下,希望会对大家有所帮助!欢迎大家继续关注其他信息!
相关文章
只要清灰降画质就能再战? GTX 1050 Ti显卡游戏性能测评
GeForce GTX 1050 Ti这款老显卡的口碑很不错,但它毕竟已经是8年前的老产品,本文的测试目的就是评估GeForce GTX 1050 Ti在清灰,调低画质(1080P低)之后,还能否流畅运行2024-10-113080ti和rx7800xt玩游戏选哪个 3080ti和rx7800xt显卡游戏性能测试
3080ti和rx7800xt均为高性能显卡,3080ti在生产力优化上表现更佳,而rx7800xt在价格上更具优势,如果主要用途是游戏,rx7800xt的性价比更高;若涉及到生产力任务,例如视频编辑2024-10-113080ti和4060ti相差多大 3080ti和4060ti显卡差距对比
3080ti相比4060ti在性能上有显著提升,主要体现在流处理器数量、核心面积、显存容量和位宽上,通过游戏和跑分测试,3080ti在4k分辨率下的表现明显优于4060ti,平均帧数高出60%2024-10-10- 如果你正在为升级显卡而烦恼,不知道该选哪一款,那么这篇文章绝对能帮你理清思路,下面我们我们将从参数、性能等对比RTX3060和4060的区别2024-10-10
rtx3070和rtx3060ti怎么选 rtx3070和rtx3060ti性能对比详解
NVIDIA的RTX 3060Ti与RTX 3070都是高性能显卡,3070性能略优,但两者差距不大,在2K分辨率下,3070在游戏测试中表现略好,平均帧数提升约15%,但两者在游戏体验上没有质的区别,对2024-10-095090和5080性能差多少 5090和5080显卡区别介绍
RTX5090相比RTX5080,在CUDA核心数、显存容量、显存位宽和功耗等方面都有明显提升,RTX5090拥有24576个CUDA核心和28GB GDDR7显存,而RTX5080则拥有10752个CUDA核心和16GB GDDR2024-10-083070ti和4060ti哪个好 3070ti和4060ti显卡差异对比
在显卡性能对比中,RTX 3070 Ti相较RTX 4060 Ti表现更优,具有更多流处理器和较大的核心面积,显存位宽也更宽广,尽管4060 Ti的频率略高,但在多数游戏测试中,3070 Ti的帧率普遍2024-10-06RTX 4070 SUPER显卡极限性能如何? 七款4K游戏性能测评
本文将分享GeForce RTX 4070 SUPER的4K画质游戏测试,评估它的极限性能,供有兴趣、有需要的朋友参考,除了性能之外,大家还可以重点了解一下它的功耗和温度表现2024-10-013090和6900xt哪款好 3090和6900xt对比介绍
AMD RX 6900 XT和GeForce RTX 3090是同期发布的高端显卡,它们在游戏性能和生产力应用方面表现各有千秋,在游戏性能测试中,两者表现相近,有的游戏中RTX 3090表现更佳,而有的2024-09-30显卡应该怎么选? 不同需求的玩家显卡选购建议 用4年都不过时
CPU和显卡算是一台电脑中售价最贵的硬件了,也是最核心的硬件,今天我们就来看看不同需求的玩家如何选购显卡2024-09-29
最新评论