图形与计算的融合,AMD GCN架构解析

图形与计算的融合,AMD GCN架构解析

在使用GPU这个通用性的称呼之前,显卡其实还有另一个名字—3D加速卡。顾名思义,当时的显卡主要是加速3D运算的,虽然现在的显卡主要用途也是3D渲染,做的也是差不多相同的工作,但是这其中的含义和复杂程度就大不一样了。

图形与计算的融合,AMD GCN架构解析

图形与计算的融合,AMD GCN架构解析GPU渲染图形的进化史

早期的渲染过程很简单,主要是几何变换以及光照渲染,当时评价显卡性能的指标主要就是T&L(Transform&Lighting)单元的多少,这个时期大约是十年前的事了。再往后显卡的结构也越来越复杂,开始大规模应用三角形生成模型,建模需要vertex顶点坐标和pixel像素填充,VS顶点渲染器和PS像素渲染器就成了显卡的主要运算单元了,运算流程就大概如上图所示,一直到5年前的DX9时代都是如此。

之后的事就更热闹了,微软的DX10规范取消了VS和PS渲染单元,变为“统一处理器”,也叫做流处理器(StreamProcessor),现在我们看到显卡的基础构成都是基于流处理器的,只是AMD和NVIDIA两家的设计方式不同,叫法也不一样。

NVIDIA从G80开始走的是MIMD(多指令多数据)的1D标量体系,架构变化很大,而AMD从第一款DX10显卡HD2900系列开始一直都是改良型4D+1D架构,也就是俗称的VLIW5体系,好处是电路设计没那么复杂,SP数量容易扩展,这个体系一直用到HD6800系列显卡上。

HD6900显卡发布时,AMD将VLIW5架构做了一些改进,变为VLIW4架构,减少了那个4D+1D中的1D超标量单元,同时增强了剩下的4D矢量单元的性能,因此HD6900系列在SP总数减少的同时性能其实是提升的,有关VLIW4架构的详细内容可以参考超能的HD6970显卡评测。

VLIW架构对图形计算来说是好的,但是随着流处理器数量的不断增多,其效率低下的问题也日益严重,长指令拼接很依赖调度管理,而实际运算不一定就是最优组合。再者说,如今DX游戏的画质很难再有质的突破(除非光线追踪技术成熟),显卡的单纯3D渲染提升乏力,反倒是GPU通用计算增长迅猛,AMD的VLIW架构的理论运算性能要强于对手产品,但是实际表现以及推广应用上都是要远远落后于对手的。

在这样的背景下,AMD于今年中公布了下一代HD7000显卡的架构,代号为“GraphicCoreNext”(简称GCN),GCN架构将不再沿用SIMD的VLIW体系,而是全新的革命性架构,除了传统的3D运算之外,它还在GPU通用计算上洗心革面,是AMD首次针对3D渲染/GPU计算双重使命而设计的。

图形与计算的融合,AMD GCN架构解析

图形与计算的融合,AMD GCN架构解析使用GCN架构的HD7970显卡将成为一个分水冷

经过半年多的准备,本文发布的时候实际HD7970已经正式发布了,它的性能、功耗以及技术介绍已经不是秘密了。由于坑爹的发布策略,国内媒体是没得测,没得发,甚至没有卡,本文只能介绍一下GCN的架构设计特点,看看AMD引以为傲的GCN架构到底有什么过人之处。

泊祎回收网遵循行业规范,任何转载的稿件都会明确标注作者和来源;

发布者:泊祎回收网,转载请注明出处:https://www.huishou5.net/dianzi/75692.html

(0)
打赏 微信扫一扫 微信扫一扫
泊祎回收网泊祎回收网
上一篇 2021年6月8日
下一篇 2021年6月8日

相关推荐

电话

联系我们

1388-0022-916

在线咨询:点击这里给我发消息

邮件:1395700887@qq.com

工作时间:周一至周日,9:30-18:30,节假日无休

微信
微信
分享本页
返回顶部