二、新RAS特性在新至强处理器上得到充分应用

英特尔宣称,新的Xeon提供了不少于 20项新的 RAS特性,这些特性大多来源于 Itanium,其中一些特性是专门应资深专业IT人士的需求而特别提供的。现在我们就来具体了解一下,有谁见过服务器崩溃是因为CPU损坏而产生的? 每个CPU运行故障的产生大都是因为相关软件的的错误而引起的,在这里,我们并不特别关注极少用到的物理CPU添加和移除功能,相信对于大多数IT业内人士及尖端专业用户都会同意这个观点。绝大多数专业用户都会用巨额预算来保证服务器系统的正常运行,因为一担出错,他们的位置肯定就会不稳,他们将会失去高额的薪水,同时他们所处的公司也将会因出错而造成天文数字的损失。因此这些用户对于系统的稳定性拥有一长串的强烈要求。


高端风采 戴尔Nehalem-EX服务器评测
Nehalem-EX可靠性

具有讽刺意味的事,出于对于稳定性的要求,人们相当强调对于RAS特性的看中,实际上,对于稳定性危害最大的并不是CPU方面,而是在于内存及软件方面,根据地根据谷歌搜索引擎的统计资料,每年有 8%  DIMM会发布可修复错误,有0.22%会发布不可修复错误,现在的服务器内存容量动不动就达到TB级,新的服务器都开始将32、64条内存插槽作为标配,统计显示,内存方面的出现的问题反而比CPU更大。

高端风采 戴尔Nehalem-EX服务器评测
MCA技术

解决这个问题的办法之一就是MCAMachine Check Architecture)技术,通过这个技术,系统就会利用 L3缓存来检测并排除“坏”的内存区域而使用“好”的区域来运行相应的软件程序,以确保整个系统的稳定性。拥有更多容量的内存是最有效的解决这方面问题的办法。而 Nehalem EX CPU通过对于 QPI links 应用的提升和改进强化了这方面的性能。


相关内容

    暂无相关文章