GPU推动HPC普及,Tesla K10性能揭秘

这两天时值国际超级计算大会,Intel推出了MIC多核架构的商品化品牌XeonPhi,NVIDIA作为GPU计算阵营的代表也没闲着,也向公众展示了GPU计算在HPC领域的成就,并首次公开了TeslaK10的性能。

Top500的性能排名是基于LinpackFortran矩阵数学测试而来的,这是一种双精度运算,不过实际应用中基于单精度的运算依然占相当大比例,这正是TeslaK10擅长的地方。

GPU计算卡在HPC中通常扮演协处理器的角色,它可以极大地提高HPC的峰值性能,四年前IBM“走鹃”计算机使用的就是AMD六核Optron处理器加IBMCell协处理器的方式首次达到Petaflops千万亿级计算性能的。(国内的天河-1A也是处理器+协处理器的方式冲顶的,使用的协处理器就是NVIDIAFermi架构的M2090计算卡)

GPU推动HPC普及,Tesla K10性能揭秘

NVIDIA在2007年正式推出Tesla计算卡,不过到2008年Tesla卡才具备基本的双精度计算能力。2010年发布的Tesla20系列基于Fermi核心,支持GDDR5显存内ECC纠错,双精度性能也大幅提升,相比传统CPU方案,基于Tesla的HPC不仅更便宜,而且功耗更低,在散热和能耗上可以节省大笔投资。

2012年上半年的Top500超级计算机中有58套系统使用了协处理器设计,其中53套基于NVIDIATesla计算卡,2套使用AMD显卡,一套使用Intel刚刚定名的XeonPhi处理器(ps:这才56套,还有2套是什么协处理器没提到)

GPU推动HPC普及,Tesla K10性能揭秘

Top500中使用GPU协助计算的平台越来越多

排名前10的系统中有三套使用了Tesla计算卡,这一数值与一年前相比没有变化,11-50排名中有4套,翻了一倍,51-100的HPC中增加200%,而101-500的系统中数量增加了680%,用NVIDIATesla事业部高级产品经理SumitGupta的话说,“GPU使得HPC更加大众化,排名后400的系列中使用Tesla计算卡的系统达到前一年的8倍”。

他说实际上NVIDIA更关注的是不在Top500名单上的其他4000套HPC,NVIDIA的Tesla正在驱动HPC走向大众化。借助GPU的能力,一些规模较小的大学也构建Top500级别的小型计算中心。

为此,NVIDIA已经不再像上一代Fermi架构那样追求同步提升Tesla显卡的单精度和双精度性能,其中使用两颗GK104核心的TeslaK10主要面向单精度运算需求,浮点性能可达4.58TFLOPS,搭配8GBGDDR5显存。

基于GK110架构的TeslaK20主要面向双精度运算,双精度性能可达2TFlops,两倍于Intel刚刚宣布的XeonPhi,二者都将在年底发布。

GPU推动HPC普及,Tesla K10性能揭秘

K10上的每颗GPU都有160GB/s的带宽,整块显卡则有320GB/s的吞吐带宽,与50GB/s带宽的SandyBridge架构的XeonE5-2600相比,K10达到后者的6.4倍之多,即便与前代177.6GB/s带宽的M2090相比也有近一倍提升。

说了这么多,来看看TeslaK10真正的计算性能吧,对比的是上一代的M2090,当然测试基本都是基于单精度运算的。

GPU推动HPC普及,Tesla K10性能揭秘

K10展示出了强大的性能,整体大约是M2090的2-3倍。

其中,Amber是分子动力学模型软件,2009年时它在96颗X86处理器组成的服务器上花了一天时间才完成了23558个原子大约46ns(纳秒)的模拟运算,而使用8颗M2050计算卡一天内就可以完成52ns的运算,如果使用M2090则可以完成69ns的运算量。

到了今年,使用两颗K10计算卡就可以完成66ns的运算量,如果也使用8块K10运算的话那就可以完成四倍的运算量。

除了地震预测及分子动力学计算之外,K10同样也适用于卫星图像处理、视频增强、信号处理、计算机视觉、视频转码以及数字处理等领域,前提是对双精度运算要求不高。

来源:theregiste

泊祎回收网遵循行业规范,任何转载的稿件都会明确标注作者和来源;

发布者:泊祎回收网,转载请注明出处:https://www.huishou5.net/dianzi/158449.html

(0)
打赏 微信扫一扫 微信扫一扫
泊祎回收网泊祎回收网
上一篇 2021年8月29日
下一篇 2021年8月29日

相关推荐

  • 2016年3500元i3-6100搭配GTX950主流游戏台式机配置推荐

    如今主流装机方案中,热门主流无非就是i3、i5平台,定位中端的i3平台已经足够满足绝大数用户需求,面向2016年装机,我们无疑选用最新六代i3系列、DDR4内存、SSD固态硬盘,下面泊祎电脑回收分享一款3500元i3-6100搭配GTX950电脑配置单,具体配置如下:201

    2021年4月25日
    266
  • 都微软Surface Pro4笔记本回收价格(2021回收报价)-换

    微软SurfacePro4现在多少钱回收?估价¥2692.00元。 SurfacePro4专业键盘盖由优质材料制成,触感柔软,然而坚固耐用,打字时更安静。提供多个颜色,让您尽情展现…

    2021年9月1日
    273
  • 华硕P8H61-M LE蓝屏怎么办

    华硕P8H61-MLE电脑蓝屏怎么办?很有可能是64位系统的事情,这个主板的64位驱动貌似不太好。驱动姑且没有办法,但是也不能改成32位的系统,否则大内存就没法用了。可以尝试刷一下…

    2021年7月7日
    238
  • 跟苹果CEO聊聊股价?库克咖啡慈善拍卖已标到23万美元

    股神巴菲特每年都会拍卖一次共进午餐的机会,所得收入会捐给慈善机构(绝不含郭美美成分),去年6月份的午餐创造了346万美元的记录,步步高老总段永平、私募投资基金风云人物赵丹阳都曾贡献…

    2021年6月20日
    216
  • 越大越好,今年大屏智能手机出货量将达到6000万台

    随着大屏智能手机越来越流行,IHSiSuppli研究公司预测,今年5英寸或更大屏幕的智能手机的出货量将至少比去年翻一番,从2012年的2500万台增长到今年的超过6000万台。 2…

    2021年6月4日
    211
  • 欲战五年!十代i7-10700KF配RTX2060独显主机配置清单及价格

    随着30系真香卡的发布,不少用户蠢蠢欲动都有升级的打算,奈何30系列显卡不是缺货就是加价。一晃来到12月,更香的甜点卡RTX3060Ti各路消息齐出又勾起了我的欲望,虽然性能媲美RTX2080Super,不过现货价格已经都快接近4000元了,我一个朋友也给我无脑推荐,但是我考虑了很久,一方面是价格太贵了,另一方面就是本人实际上对显卡要求也没有那么高,所以依然考虑RTX2060

    2021年4月25日
    282
电话

联系我们

1388-0022-916

在线咨询:点击这里给我发消息

邮件:1395700887@qq.com

工作时间:周一至周日,9:30-18:30,节假日无休

微信
微信
分享本页
返回顶部