推行预防性维护

常规性的预防维护措施或许是支撑服务器可靠运行最容易,也最少痛苦的方法。“系统的正常运行时间只能和整个系统中最弱组件的正常运行时间一样长,”Beddoe说。长此以往地执行各项基本任务——升级系统软件、提供有条件的电力,保证适当的冷却环境——方能在不突破预算的前提下让数据中心的服务器无故障地运行,才可不必从其他关键任务组抽调人手来修复故障。

Paul Franko,在线资源公司的CTO认为,工作态度在服务器管理中可以发挥巨大的作用。他说他他进行了一项额外的努力,以确保常规但很关键的服务器相关工作能够被认真严肃地对待,并及时得到处理。

Franko说,为了确保所有必须要做的工作在需要时加以贯彻,就应该确定哪些工作是服务器维护工作,并将它们组织成明确的日程表。“有些事情是必须立刻执行的,比如安全升级,而其他一些任务批量执行,或者每隔一段固定期限加以执行是比较合理的。”这第二类任务就包括软件非关键性功能改进的升级等。

Franko补充说,服务器的维护工作应该这样加以处理:维护工作本身不应占用服务器的正常运行时间。“我们不能为了进行某些维护工作而让系统的运行速度下降,无论如何,我们都得做到这一点。”

如果必须拆下某台服务器进行维护的话,Franko的团队就会把这项维护工作安排到午夜或周末,用户的需求量很低的时候进行。在正常工作时间拆下一台功能服务器的唯一理由只能是必须安装或执行关键性的软件升级,例如需要安装零日安全补丁。


相关内容