无需深厚技术背景 也可做好系统和应用维护管理(1)


51CTO.com 综合报道】做好系统和应用维护势在必行

如何做好IT系统的运行维护是IT领域的热点问题. 随着信息化技术的蓬勃发展,信息化建设的深入,运维管理的难度也越来越大。 如何管理好IT系统,保证其可用、安全、可靠、高效地运行,提高用户满意度、降低运维服务成本、保证系统能够在遇到突发事件时快速地解决。是当下严峻而又现实的问题。

作为运维服务提供者,无论是管理人员还是运维人员,经常会遇到这样的情景:

梦深时分,急促的铃声响起,电话接通,在电话的另一头,有人急切地说道:“一位公司领导反映,公司的网站登录不了,邮件无法正常发送,首页显示空白”,一般这种情况下,你会要求现场人员尝试恢复服务,但现场人员往往不能独立解决,此时你需要协调技术专家去出面搞定这个问题,但如果问题棘手呢,那此时就需要综合各方高人进行会诊。通过逐一询问运维组的检查情况,细致了解了包括防火墙、入侵监测、操作系统、数据库的设置、Web服务器以及自身的运行情况后,系统问题仍然无法定位。

就在你准备放弃的时候,打算采取应急方案的时候,正常的界面又忽然显示了,只是很快,但刷新后又重复出现非正常。他们的联系在哪里,问题在哪里,你得找出根本原因。

经过多番种种努力,你忽然想到一点,昨天客户好像提过要对硬件做升级,如果所料不错的话,应该是昨天晚上就进行了,但因为某种原因,升级并没有成功,客户的操作步骤也没提前通知,具体操作如何谁也不清楚。这时候你会给客户打电话汇报情况,并要求客户方安排人员来解决,

终于在多方人员的努力下,系统恢复正常运行,大家一起舒了一口长气,同时开始抱怨“怎么能这样?他们也太过分了,居然进行升级都不跟我们打个招呼,明天一定得好好的跟他们领导反映”。

以上的情景我相信绝大多数运维服务提供者都能遇到,并且不止一次两次。为什么会产生这些问题呢?如果在此次事件中,整个系统有了变更管理环节,当客户进行升级,就必须通过变更管理的审核和批准,否则是无法进行相应操作的,也自然不会出现应用无法访问的问题,这对运营维护好IT系统以及提供完善的IT服务有着重要的意义。

系统与应用维护都有哪些困难 

◆服务器操作系统

操作系统是服务器运行的软件基础,其重要性不用说大家都明白。如果使用Windows xp或Windows 2000 Server作为操作系统,维护起来还是比较容易的,只要按时打好补丁,定时查看日志就可以。但如果是LINUX和UNIX操作系统的话,需要对运维人员的技术有相当高的要求,需要具备一定的专业知识。 

◆服务器上的应用维护

服务器上的应用软件是企业的核心数据,是企业最重要的数据之一,如果数据丢失或者服务异常终止对于企业来说所造成的损失是不可估量的,企业的应用已经成了企业生存和发展的重要组成部分。当企业应用的规模越来越大时,应用也随之越来越多,如何快速有效的对这些关键应用进行监控就成为了迫切的问题。 

◆7*24小时服务周期

除了上述二点列出的技术上的困难之外,还有一个重要的问题就是企业的服务器以及上面所运行的应用都是实时性很高的业务,必须得保证7*24小时不间断提供服务,单纯的靠人工维护的话实时性太差,管理员不可能一天二十四小时盯着服务器,所以在现实情况中,经常出现服务器宕机或者服务器上的应用不能访问,运维人员往往无法第一时间知晓,而是由实际使用服务器或使用应用的人去通知,此时业务可能已经停止了很长时间,这对于企业来说无疑是很大的损失,从而造成对IT运维人员的满意度下降。


相关内容