当前位置:首页 > 电子产品 > 正文

废电脑回收:双精度真被砍了?GTX 780通用计算性能测试

延伸阅读废电脑回收:双精度真被砍了?GTX 780通用计算性能测试  第1张

“亲民版”泰坦,GeForceGTX

780同步评测

GTXTitan遭遇双打,GeForceGTX780SLI测试

聪明的“选择”,GTXTitan通用计算性能及其影响

NVIDIA的GTX780和GTXTitan都源于GK110核心,而我们知道GK110这个巨核心首先是为计算而生的,除了SMX单元比GTX

680所用的GK104核心更多之外,每组SMX单元不仅有192个CUDA核心,还有专用的1/3的双精度浮点运算单元。

GTXTitan已经砍掉了专业应用的Hyper-Q及DynamicParallelism动态并行支持(更正:查了下官方pdf,是可以支持的。不过GUT

Titan不支持ECC校验,Hyper-q功能的mpi支持也被砍掉,rmda远程内存访问也没了。有人做过测试,GTXTitan的cuda5.0sdk中只可以每次执行8

streams,K20x是24streams,所以GTXTitan的通用计算功能跟k20相比还是阉割了很多,特别是ECC。),默认的1/3双精度浮点性能也是需要在驱动面板里开启的。此前我们已经对GTXTitan的GPU通用性能做了分析,那么对GTX

780来说,它的通用计算性能又是如何呢?

废电脑回收:双精度真被砍了?GTX 780通用计算性能测试  第2张

GTXTitan的双精度浮点性能在驱动面板中是默认关闭的

首先我们还是从驱动面板着手,最初得到的320.11beta驱动面板中是没有CUDA-GPUs这个选项的,测试的320.18

beta和今天的320.18WHQL驱动面板是有CUDA-GPUs这个选项的。

变化一:CUDA-GPUs选项默认打开

废电脑回收:双精度真被砍了?GTX 780通用计算性能测试  第3张

默认就是开启的

虽然有着中英文的区别,但是细看之下这两个选项是有不同的,GTXTitan的选项是CUDA-DoublePrecision(CUDA双精度),而GTX

780的是CUDA-GPUs(CUDA显卡选择),前者无疑是指明与双精度有关的,但是GTX780的不是,表面上看只是选择CUDA需要的GPU而已,并没有特指双精度。

变化二:关闭CUDA-GPUs之后部分测试会报错

废电脑回收:双精度真被砍了?GTX 780通用计算性能测试  第4张

Luxmark2.0会报错

既然有打开与关闭的选择,第一个想法就是对比这两个选项的影响,不过禁用CUDA-GPUs选项之后出现了意外问题,Luxmark

2.0及DirectComputeBenchmark测试都会报错,测试无法进行。恢复默认的开启状态就可以进行测试,而Computermark这样的软件不受影响,开关与否都可以进行测试。

变化三:CUDA-GPUs选项并不影响GPU加速频率

废电脑回收:双精度真被砍了?GTX 780通用计算性能测试  第5张

GTXTitan的通用计算测试中发现如果开启了双精度浮点运算,那么GTXTitan的双精度性能虽然有很大提升,但是GPU加速频率也降低了,不开双精度分温度加速频率是1019MHz,开启之后稳定运行频率只有849MHz。

这个情况对GTX780又不适用了,无论CUDA-GPUs开关,GTX780的加速频率都是一样的,以GPU-Z自带的渲染测试为例,两种情况下的稳定加速频率都是1006MHz,没有下降的情况。

GTX780通用性能测试:双精度性能大幅下降

废电脑回收:双精度真被砍了?GTX 780通用计算性能测试  第6张

GTX780使用了今天的WHQL驱动

对比的GTXTitan中的成绩是开了双精度选项的,因此其加速频率会比正常情况要低,而GTX780的频率不受影响,所以很多项目的测试中GTX

780落后并不大,但是这个不是要说的重点。

上述项目中明确指出用到了双精度性能的测试有两个,就是在这两个测试中GTX780都败给了GTX

Titan,而且落后比例非常大,与其他项目持平或略低的情况完全不一样,。

以OpenCL的双精度性能为例,GTXTitan的双精度性能差不多是GTX780的五倍以上,GTX

780的189.862GLFOPS的成绩只比以前测过的GTX680的134GFLOPS要高一些。数倍的差距说明二者的双精度性能有质的差异,特别是在GTX

780频率领先的情况下。

现在还没有官方消息证实GTX780的双精度浮点是多少,但是综合这里的测试来看,昨天猜测的GTX780双精度浮点性能延续了GTX

Titan的1/3水准看来是错的,GTX780的双精度性能跟GTX

Titan有质的差距,NVIDIA应该是把这部分给砍掉了,因为驱动面板中的选项名字跟双精度无关,而且开启与关闭并不影响GPU频率,说明双精度单元没有了。

现在得到的结论也是根据测试反馈出的猜测,具体如何还得看NVIDIA官方。虽然很多人纠结这个双精度问题,不过从显卡的角度来说,我一直不觉得这个问题对日常应用有什么影响,就算有着1/3的双精度性能,也不能指望这个来挖矿,专用应用的话又得看Tesla或者Quadro的。

这么看来,GTX780便宜3200块也不是没有道理的。

你可能想看: