为什么甜品架构更“健康”?

相对于Tahiti高达43亿晶体管的规模以及365平方毫米的核心面积,仅有28亿晶体管规模和212平方毫米的Pitcairn要小上很多。但Pitcairn顶级产品HD7870的绝对性能,却并未因此而落后Tahiti的次级旗舰产品HD7950很多,它与GK104/GK106架构的NVIDIA甜品级产品在性能层面上的竞争也并未落得下风,我们完全可以讲Pitcairn看做是与GK106乃至整个开普勒架构表现相当的架构,其性能功耗比更是超越了整个Tahiti架构。无论从何种角度来讲,Pitcairn都要比Tahiti“健康”很多。是什么让同属GCN架构,采用几乎完全相同技术的两款架构表现出了迥异的结果呢?

答案还是万恶的源头——寄存器。


 

显示世界的2012:年度GPU架构回顾
HD7870满载功耗相当“正常”

Pitcairn的定位在游戏级的甜品市场,它不需要承担旗舰级架构探索和收集经验的负担,只需要利用现有技术更加合理的打造产品即可。所以Pitcairn的双精度浮点运算能力仅有单精度浮点运算能力的1/16,更低的DP性能目标让它卸下了沉重的寄存器负担,进而也就避免了每个ALU多50万晶体管的窘境。

利用这部分晶体管所换来的空间,Pitcairn维持了与Tahiti接近的后端规模,这种等效放大后端/ALU比例的做法强化了Pitcairn在“纯图形”层面的表现,而更少的晶体管总量又让Pitcairn更加远离D线,这使它获得了更好控制的功耗以及挑战更高频率的机会,规模和高频率的交替作用进一步增加了Pitcairn的图形以及综合表现的得分。我们完全可以把Pitcairn看作是AMD版本的开普勒,它不仅在甜品级架构之战中为AMD守住了阵地,更为我们展现了如果Tahiti没有遇到问题时所可能的表现。

显示世界的2012:年度GPU架构回顾
Pitcairn特性一览

以GPU这种简单单元大规模并行的逻辑结构而言,决定性能的根本要素其实就是并行度和缓冲机制。大家的ALU结构,尤其是进入到Tahiti/开普勒时代之后的ALU结构和能力基本上都是相当的,谁能为ALU提供更好的缓冲并让其获得更高的复用率,谁就能获得更好的效率。Tahiti和Pitcairn同属GCN,在结构和技术应用上基本相当,唯一造成两者不同命运的重要诱因就是寄存器层面的差异。另外,历史上并不是没有出现过因为寄存器导致的悲剧,名留GPU展史册的NV3X就结结实实的栽在了寄存器使用经验不足上。命运在10年后的今天只是改改演员和台词,就把一幕内容相同的悲喜剧本拿来再一次的重演,这不能不让我们唏嘘。

 


相关内容