GK110规格扑朔迷离,3072核心、24GB显存新说

NVIDIA昨天公布了GK110架构的TeslaK20加速卡,而且给出了晶圆结构图,部分规格如显存位宽也得以确认,不过未知的东西依然很多,比如核心频率、TDP功耗、性能等等。

NV给出的图不太容易看出GK110架构的具体配置,Beyond3D论坛有人作出了配以文字说明的分析图,如下图所示:

GK110规格扑朔迷离,3072核心、24GB显存新说

图片来源于Beyond3D论坛

GK110有15组SMX单元,每组SMX单元还是维持了GK104的192个CUDA核心,16个纹理单元,理论上有2880个CUDA核心,240个纹理单元,实际启用的可能是14组SMX,总计2688个CUDA核心,224个纹理单元,ROP单元为48个。

不过Guru3D称新的消息显示GK110实际上是16组SMX单元,CUDA核心总数是3072个,如果屏蔽一组的话也有2880个CUDA核心,240个纹理单元,只是guru3D并没有给出更详细的说明。

显存位宽已经确认为384bit,不过频率未知,另外显存容量也没有公布,不过黄仁勋在演讲中称显存容量配置取决于DRAM业界,6GB、12GB甚至24GB都是有可能的。

对比一下,上一代的TeslaM2090配备的是6GB显存,TeslaK10配备的则是8GB显存,支持GPU虚拟化的NVIDIA显卡搭配的则是16GB显存,但是规格只是DDR3。如此一来,GK110搭配的显存容量不可能比上一代的6GB还低,12GB是最可能的配置,24GB容量也有可能,不过黄仁勋也说了具体容量要依赖DRAM产业界,意味着要看DRAM厂商什么时候能推出单颗容量更高的显存颗粒,目前主流的是2Gb(512MB),24GB需要48颗,现在显然没空间布置这么多显存。

以上是基于Tesla加速卡考虑的,如果是GK110显卡,最可能的显存容量应该是3GB,比GTX580高一倍,比GTX680高50%,厂商则会有6GB版非公版显卡推出。

核心频率也是未知数,3DCenter认为在800MHz左右,PCGH认为有880MHz,并且DGEMM效率高达80-85%,与Fermi架构约50%的效率高得多。以此估算GK110架构的双精度浮点效效能为:14SMX*192SP*2FLOPS*0.85*880MHz/4=1000GFLOPS,而上一代最强的计算卡M2090最高上665GFLOPS,以DGEMM计则为332GFLOPS,GK110恰好是其三倍左右。

GK110规格扑朔迷离,3072核心、24GB显存新说

NVIDIA公布的K10浮点效能只有0.19TFLOPS,K20未知

其他方面,GK110加速卡的TDP功耗是300W,使用6pin+8pin接口,预计GK110显卡的TDP功耗也是如此。

泊祎回收网遵循行业规范,任何转载的稿件都会明确标注作者和来源;

发布者:泊祎回收网,转载请注明出处:https://www.huishou5.net/dianzi/150302.html

(0)
打赏 微信扫一扫 微信扫一扫
泊祎回收网泊祎回收网
上一篇 2021年8月17日 下午5:54
下一篇 2021年8月17日

相关推荐

电话

联系我们

1388-0022-916

在线咨询:点击这里给我发消息

邮件:1395700887@qq.com

工作时间:周一至周日,9:30-18:30,节假日无休

微信
微信
分享本页
返回顶部