甜品级首发,Pitcairn

Pitcairn构架与Tahiti以及Cape Verde同属GCN体系,它拥有212平方毫米的尺寸和28亿晶体管的总规模。定位于旗舰及中端之间的Pitcairn拥有更加合适的规模及芯片面积,同时具备了Tahiti架构的绝大多数技术革新。


 

显示世界的2012:年度GPU架构回顾
基于Pitcairn架构的HD7870规格

Pitcairn拥有20组结构上同Tahiti相同的CU单元,每组CU单元拥有4个SIMD Core,每组SIMD Core包含16个Vector ALU,因此其运算资源总规模为1280个Vector ALU。除了Vector ALU之外,每组CU单元还包含4个Texture Filter Unit和16个Texture Fetch Load/Store Unit,因此Pitcairn拥有80组Texture Arroy。后端方面,Pitcairn的ROP阵列规模与Tahiti相同,均为32个,而显存部分则由4个64bit MC进行管理,构成256bit的显存位宽。不难看出,HD7870的规格是旗舰级的HD7970的62.5%,同时刚好是Cape Verde的整整一倍。

显示世界的2012:年度GPU架构回顾
游戏玩家是HD7800的目标用户

由于同属GCN体系,Pitcairn的宏观结构同Tahiti保持了一致,但由于双ACE的宏观对称格局下辖了比Tahiti更少的运算资源,后端的比例也因此而灯下的获得了放大,这些要素配合高频让Pitcairn获得了相当不错的架构效率和性能。在此基础上,Pitcairn的成本控制和功耗表现较之Tahiti也有了更大的提升,无论板卡物料成本还是芯片良率,Pitcairn都具备成为AMD盈利重点的资质。以甜品级架构而言,Pitcairn的结构和性能/功能表现全面完善,是一款相当合格的架构。

削减后的开普勒,GK106

由于NVIDIA在2012年中将产品线的常规架构总量从4个变更到了3个,对抗Pitcairn也就变成了GK104和GK106共同完成的任务。基于开普勒图形构架的GK106核心拥有221平方毫米的芯片面积。与完整规格的GK104相比,GK106运算资源总量从1536个ALU下降到了960个,Texture Filter Unit由128个减少到了80个,构成后端的ROP为原生24个。与ROP相对应的,GK106的MC结构也变成了3个64bit双通道显存控制器,显存位宽192bit。GK106拥有2048/3096MB两种显存容量搭配方案,其中2048MB采用了非对称显存布局体系。

显示世界的2012:年度GPU架构回顾
NVIDIA公布的GK106架构

GK106架构具备5组SMX单元,分别居于3个GPC中来组成并行结构。3 GPC的传统结构让它具备了3套前端以及光栅化处理部分,其单周期的几何输出以及光栅化能力为同频旗舰级架构的75%。更好的几何性能、更低的时间成本以及研发成本是它的优势。GK106架构让NVIDIA在下位甜品级以及上位中端产品区间里拥有了更好的产品可操作性,同时在面积和成本空间层面获得了较好的平衡。

显示世界的2012:年度GPU架构回顾
我们预期中的完整GK106架构

GK106可以被看做是削减一组GPC之后“再砍一刀”的开普勒。除了规模之外,它的各种结构细部特征均与开普勒架构保持一致。与微观结构进行了一定调整的GCN系列架构不同,开普勒系列架构保持了高度的一致性,它们之间仅有的规模差异表现出了高度的模块化特征,我们甚至可以从一款架构的表现以及特定的规模限定规则来推定出其他所有开普勒架构产品的大致性能。只要规则合理,开普勒系列架构的性能控制会更加容易且具有规律性。

与之相对应的,GCN架构内部的表现就要相对差一些,Pitcairn在宏观结构上虽然保持了与Tahiti的一致,但它的微观结构却存在着与Tahiti架构的不同,而Pitcairn较之Tahiti更加优秀的综合表现,正是这一不同所导致的。


相关内容