三、Uncore在Nehalem-EX中的重要作用

让八核心处理器能吃饱实际上也是一样很困难的事情,我们不能简单的把需要处理的数据随便累积在一起让缓存进行处理,我们需要考虑到 uncore 部分。当我们需要八核心全部在满负荷状态下工作时,对于处理器L3缓存的要求就很高了, 英特尔用32位的双循环计数环和八块独立的 3MB 缓存设计来确保 L3缓存可以提供最高 200GB/s数据交换以及低至 21ns的数据延迟,满足最低限度要求的缓存可以过滤延迟带来的性能损失,使其不致于影响整个系统的性能表现


高端风采 戴尔Nehalem-EX服务器评测
QPI总线

内存控制器、缓存、 QPI链中间有一个八口路进行着综合管理工作,这同时也增加了 18ns的延迟,其理论数据运行带宽为 120GB/s,每个内存控制器提供了两个SMI通道以满足内存缓冲的需求。这种设计可以起到 AMBs 在 FB-DIMMs 中的作用,DIMM并行的提供位宽通道 (64位/DIMM),缓存在将数据传输到内存控制器之前就预先读满相关数据。这就使得英特尔可以为每块CPU提供四条内存通道,如果没有上述良好的内存传输介面设计,主板上将会布满数以百计的复杂的并行线路。

高端风采 戴尔Nehalem-EX服务器评测
集成内存控制器

每个SMI单元可以提供 6.4GB/s数据带宽,整个系统就可以提供其两倍即12.8GB/s的总带宽,而每个SMB单元又是由两个DDR3-1066内存组成,每个SMB最大功耗为10W,这也就意味着在工作中,SMB至少要消耗掉7W的功率,在我们提供的DELL的主板图片当中,我们可以看到专门为其设计的小风扇。

每块 CPU都有两个内存接口来与两个 SMB进行通讯,每个SMB又驱动着两个双通道内存插槽,这样算来,每块 CPU就可以支持八条频率为1066MHz的DDR3内存.以最小的每个DDR通道提供两个DIMM插槽来计算,每个CPU可以提供对四个DIMM的支持,因此我们就可以看到四路至强Xeon 7500服务器可以提供超过64个内存插槽的设计,而每个DIMM最高可以支持四倍于16GB容量,因此四路至强Xeon 7500服务器最高可以支持到高达1TB的内存,这也是为什么英特尔Nehalem EX平台才能够提供高带宽以及巨大的内存容量。从另一面来看,这也导致了数据延迟的增加以及因SMB的应用还产生的功耗的增加。


相关内容

    暂无相关文章