数据中心运营商在疫情期间如何应可靠性监管,三大运营商数据中心


一些数据中心运营商表示,持续蔓延的疫情导致一些数据中心服务中断,而行业专家表示正在密切关注数据中心行业的发展。

冠状病毒疫情迫使数据中心运营商在防护和安全方面加大投资,以使其系统更加强大。疫情给他们带来的困难变得如此巨大,以至于数据中心提供的一些服务失败。

英国一位政府官员在日前举办的一次行业会议上说,不可靠的数据基础设施破坏经济和社会的风险已经变得如此之大,以至于英国政府正在考虑制定法律迫使其变得更具弹性。在疫情发生之后,政府部门首次将物理数据基础设施视为一个独特的行业,在此之前,它被认为是对其他关键行业的支持服务。政府官员已经开始考虑这将对数据中心行业的发展带来的影响。

然而,数据中心运营商将数据服务的弹性不足归咎于软件供应商,并声称这影响了数据中心行业的发展,尽管他们自己的物理基础设施正变得更加可靠。

政府和企业高管在行业会议上建议,数据中心行业已经在计划采取进一步措施,以提高其抵御故障和灾难的能力,这可能会提高运营成本,但肯定需要更多的投资。

根据数据中心标准机构Uptime Institute公司统计,作为一直对具有弹性著称并对其成就感到自豪的数据中心行业,数据中心运营商已经致力采用更多的安全保障和故障切换系统,以保证数据服务在平均99.982%的时间内保持运行,无论发生什么灾难。作为此类预防措施制定和认证标准的机构。UptimeInstitute公司总经理And yLawrence表示,可靠性指标是大多数数据中心运营商所渴望的,即使他们实际上没有达到这一标准,但Uptime Institute是按照其“Tier III”标准设计数据中心。有人呼吁数据服务要像电力一样可靠。

3%的数据中心运营商报告数据中心停机

根据Uptime Institute公司计划在本月晚些时候发布的一项调查显示,3%的数据中心运营商承认,由于他们的数据中心的应急措施无法应对冠状病毒疫情的影响,因此导致他们的服务完全崩溃并失败。Uptime Institute公司并不知道中断有多严重,或者它们对数据中心行业的整体可靠性有何影响。数据中心工程师兼顾问Amber Williamson表示,但这些失败大致代表了在疫情严峻情况下行业的表现。他在会议上介绍了Uptime Institute公司的调查结果。

Williamson说,这些运营商所报告的数据中心中断可能是异常情况。她说:“TierIII数据中心应该能够在不影响IT和服务的情况下进行任何维护。它们根本不会出现任何中断。”

Williamson说,数据中心服务中断可能是由于严重的人员短缺造成的,因为为了阻止病毒传播很多人在家隔离。她说,数据中心维护人员在遇到故障或问题时可能会缺席,而且也可能没有备件。

数据中心基础设施弹性方面的新投资

根据Uptime Institute公司未发布的调查,三分之二的数据中心运营商计划提高其数据中心设施的弹性,以应对疫情的影响。这意味着构建更多的冗余系统,可以在紧急情况下接管。

Williamson说:“我们将看到提高了弹性,这意味着我们将增加资本支出。”一家云计算提供商已经要求其数据中心提供商今后必须为每个基础数据中心组件(如冷却和电源)配备两个冗余系统。

这项研究报告的作者之一、Uptime Institute公司总经理Andy Lawrence表示,人员短缺意味着需要更大的弹性。他说:“如果希望继续进行运营,那么在数据中心现场的运营人数就更少了,那么显然必须计划即使组件出现故障也要继续进行运营。其容错度为TierIV标准。”

根据Uptime Institute公司去年对1100家数据中心运营商进行的年度调查,数据中心行业在疫情发生之前已经面临关键技能短缺的问题。这份报告指出,人们越来越相信数据服务需要100%的可靠性,以使其像电力一样可靠,因为无人驾驶汽车之类的创新技术正变得至关重要。Lawrence表示,业界已经对Tier IV数据中心的可靠性表现出了更大的兴趣,Uptime Institute公司认为它能够提供99.995%的正常运行时间。大多数数据中心根本不寻求对其可靠性的正式认证。

英国政府关注的数据中心可靠性

英国文化、媒体和体育部(DCMS)一直负责在疫情期间保持国家数据基础设施的运行,一直在尝试确定其是否确实具有足够的弹性,以确保在运行重要数据服务时不会失败。根据政府官员在会议上的演讲,医院和经济需要它,这是由于周四举办的网络研讨会。

英国文化、媒体和体育部(DCMS)开放政府和开放数据负责人Sam Roberts在行业机构techUK日前举办的一次网络研讨会上说:“我们非常热衷于了解数据中心行业的性质,以及如何确保政策制定能适应未来的发展。这可能是诸如技能、获得材料以及内在的结构弹性之类的东西。冠状病毒疫情已成为物理数据基础设施至关重要的焦点。我们将其视为实现更广泛的经济和社会成果的重要基础设施,这一点非常重要。”

他说,“我们认为,需要审慎评估数据中心行业的弹性。这是英国政府首次全面考察数据中心行业的能力,而不是其他行业的供应链。这是政府看待数据中心行业的方式的一个重大转变。”他是数据基础设施弹性团队的代表,该团队于今年3月成立,旨在确保重要的数据服务在疫情危机期间保持运转。

他说:“我们正在评估政府是否可以发挥更大的作用。但是英国文化、媒体和体育部(DCMS)意识到,弹性和安全性已经成为数据基础设施领域的竞争驱动力。”

他表示,他带领的弹性团队将继续工作一年,以解决数据中心行业的弹性和安全性问题。与此同时,该小组的紧急工作有所缓解。

他表示,英国政府正在考虑是否将物理数据基础设施指定为关键国家基础设施(CNI)的正式组成部分。迄今为止,数据中心在向其他CNI部门(例如卫生部门)提供数据时,一直被视为关键国家基础设施(CNI)。现在,由于政府将数据基础设施视为一个独特的部门,这个问题变得非常重要。数据中心运营商表示不愿意作为关键国家基础设施(CNI)而带来更多的监管。

软件弹性并不完全存在

数据中心运营商Virtus公司首席执行官Neil Cresswell在此次网络研讨会说,物理数据基础设施的弹性正在增强。

他说:“也许在软件层面的弹性还不足够。这场危机迫使Virtus公司70%至80%的普通员工在家隔离。而管理层的选择是生死攸关的选择之一。企业并不希望强迫员工去数据中心现场工作,如果由于疫情导致患病或死亡是不值得的。”

Virtus公司一直在尽其所能提高弹性,并加速使用远程管理系统,因此员工不需要在现场操作和维护就可以自动执行操作和维修。

Cresswell说,但是严格防范疫情的要求和供应链瓶颈使Virtus公司数据中心的建设推迟了三个月。他援引行业媒体的报道说,在疫情期间,对数据服务的需求几乎翻了一番。

全球较大的数据中心运营商之一,世邦魏理仕数据中心解决方案执行总监Andrew Jay在会议上表示,数据基础设施的弹性在疫情期间实际上正在下降,但这是由于软件方面的问题。

他说:“如果人们认为他们需要超越Tier III标准,那将涉及成本和效率。很多人想了解更多有关这种增强的弹性的信息。”

Uptime Institute公司在其2019年年度调查中表示,数据中心中断事件的三分之二是由软件和网络问题引起的,这表明它们可能超出了数据中心运营商的控制范围。另外三分之一是由数据中心的电源故障引起的。

数据中心中断带来的损失仍然是昂贵和普遍的。去年有三分之一的数据中心运营商发生了故障。五分之一的数据中心运营商表示,面临非常严重的情况,以至造成经济损失、声誉受损、违反法规和安全问题。十分之一的数据中心运营商表示,数据中心中断平均造成了100万美元的损失。

对Uptime Institute公司调查进行回应的250多家数据中心运营商几乎都表示,由于其在疫情严格条件下的运营经验,他们打算更多地使用远程管理技术。四分之三的受访者表示他们打算使用自动化技术。

相关内容