当前位置：首页 > 电子产品 > 正文

图形与计算的融合，AMD GCN架构解析

电子产品
2021-06-08
286
更新：2021-06-08 06:58:13

图形与计算的融合，AMD GCN架构解析第1张

在使用GPU这个通用性的称呼之前，显卡其实还有另一个名字---3D加速卡。顾名思义，当时的显卡主要是加速3D运算的，虽然现在的显卡主要用途也是3D渲染，做的也是差不多相同的工作，但是这其中的含义和复杂程度就大不一样了。

图形与计算的融合，AMD GCN架构解析第2张

GPU渲染图形的进化史

早期的渲染过程很简单，主要是几何变换以及光照渲染，当时评价显卡性能的指标主要就是T&L（Transform&Lighting）单元的多少，这个时期大约是十年前的事了。再往后显卡的结构也越来越复杂，开始大规模应用三角形生成模型，建模需要vertex顶点坐标和pixel像素填充，VS顶点渲染器和PS像素渲染器就成了显卡的主要运算单元了，运算流程就大概如上图所示，一直到5年前的DX9时代都是如此。

之后的事就更热闹了，微软的DX10规范取消了VS和PS渲染单元，变为“统一处理器”，也叫做流处理器（StreamProcessor），现在我们看到显卡的基础构成都是基于流处理器的，只是AMD和NVIDIA两家的设计方式不同，叫法也不一样。

NVIDIA从G80开始走的是MIMD（多指令多数据）的1D标量体系，架构变化很大，而AMD从第一款DX10显卡HD2900系列开始一直都是改良型4D+1D架构，也就是俗称的VLIW5体系，好处是电路设计没那么复杂，SP数量容易扩展，这个体系一直用到HD6800系列显卡上。

HD6900显卡发布时，AMD将VLIW5架构做了一些改进，变为VLIW4架构，减少了那个4D+1D中的1D超标量单元，同时增强了剩下的4D矢量单元的性能，因此HD6900系列在SP总数减少的同时性能其实是提升的，有关VLIW4架构的详细内容可以参考超能的HD6970显卡评测。

VLIW架构对图形计算来说是好的，但是随着流处理器数量的不断增多，其效率低下的问题也日益严重，长指令拼接很依赖调度管理，而实际运算不一定就是最优组合。再者说，如今DX游戏的画质很难再有质的突破（除非光线追踪技术成熟），显卡的单纯3D渲染提升乏力，反倒是GPU通用计算增长迅猛，AMD的VLIW架构的理论运算性能要强于对手产品，但是实际表现以及推广应用上都是要远远落后于对手的。

在这样的背景下，AMD于今年中公布了下一代HD7000显卡的架构，代号为“GraphicCoreNext”（简称GCN），GCN架构将不再沿用SIMD的VLIW体系，而是全新的革命性架构，除了传统的3D运算之外，它还在GPU通用计算上洗心革面，是AMD首次针对3D渲染/GPU计算双重使命而设计的。

图形与计算的融合，AMD GCN架构解析第4张