致死原因一:电源故障

停电自然会引起服务器宕机,还没有哪个服务器不用电的吧。在刚刚过去的2010年,闪电、风暴、洪水、转换开关的失误都是今年数据中心停电的罪魁祸首,大量的社会媒体网站,如Twitter、Facebook以及一些免费托管的服务器群都有严重的断电现象。在2010年,主要电子商务商服务的服务器就出现了四次严重断电,导致数百万美元的交易流产,甚至连政府服务网站也出现宕机事件。

iWeb的CL数据中心因火灾迫使3000台虚拟服务器主机转用发电机设备进行供电,其中三台发电机正常启动,另外一台因转换开关故障而启动失败。一旦UPS电源被耗尽,该数据中心将有三分之一的设备宕机。大约一小时后电力恢复,但至少有450台的服务器没有重新启动,需要进行人工操作,一直持续到4日的下午4点所有的服务器才开始正常运行。通过这一事件,iWeb在博客中表示,该公司每星期都会对备用电力设备进行测试,防止同类情况发生。

在此前的9月16日,网上银行门户网站Chase.com在遭遇了14号和15号漫长的停电而停机后重新上线,但是冗长的等待过程导致了定期支付账单无法按时交易。该网上银行门户网站表示:将退客户还在此期间产生的的滞纳金,并对此事件进行公开道歉。

在5月初,Amazon云计算服务4次因停电而发生故障,5月4日的两次故障的原因则分别是一个UPS单元故障和人为操作失误;5月8日因配电屏电气接地和短路引发的停电曾导致部分用户失去服务长达7个小时,而且还导致极少量用户的数据丢失。而在5月11日,停电故障则是因为一辆汽车撞倒了Amazon数据中心附近的高压电线杆,而数据中心的配电开关又未能正常地从公用电网切换到内部的备用发电机(配电自动化系统错误地将停电原因理解为电气接地)。


相关内容

    暂无相关文章