日常IT运维管理面临诸多难题,具体体现在以下多个方面:

网络设备

在企业IT基础设施的搭建过程中,底层的网络设备厂商和类型多样且复杂。随之而来的问题是:如何将不同厂商的网络和应用管理产品在界面级、消息级和数据级集成起来实现统一管理?如何让IT管理员了解到整个网络全局的运行情况、发展趋势和可能存在的故障隐患点,以便及时采取相应措施,实现事前管理。

拿曾经碰到过的一个典型客户来说,它的网络中有11种厂商的路由交换设备,还有存储设备,安全设备,UPS等。同时还拥有:小型机,服务器等,上层的业务系统有OA和CRM等。这样大而复杂的一个网络环境,该怎么管呢?

北塔软件认为,首先需要解决的是对IT基础设施的管理,管理范围要能覆盖到机房所有硬件设备。这一点是前提和基础。其次,才是对各种应用系统做到很好的监控。最后,才能为业务系统提供足够的保障。

网络流量

在绝大多数的企业网络中,存在不同程度的网络延迟,造成重要业务和应用时断时续,这直接成为企业业务的杀手。另外,网络的带宽也是企业关心的重点。比如,哪个时间段很拥挤,哪个时间段很空闲,有没有规律,怎么样去调查拥塞的原因,网络带宽都是被谁占用了,是被哪些客户端、哪些应用或者异常应用所占用了。这些都是摆在每一个企业运维管理领域中很实际的问题。

该如何很好的解决这些问题呢?

根据多年的运维管理经验得出,对于这种情况,需要采用流量分析的方式。通过对出口流量或者监控对象进行采集,进行24小时实时的监控和分析,可以对流量进行多角度多层次的挖掘分析,比如按照流量、数据包个数、连接数、协议等类别分析当前网络的负载情况,为网络的优化配置提供参考。通过报表分析展现流量特征,让IT管理员明白流量被谁、被何种应用、被何种异常行为占用得怎么样。

IT运维管理怎么样帮助IT管理员判断和控制安全问题,也就是作为与防病毒、防火墙、IPS等安全产品不同的角色,从网络的整体情况要能够判断未知的安全问题,并提供修复方案,在不影响正常网络运行状况下将安全问题防患于未然。如果IT管理员能针对异常行为的特征建立自动告警,在某些安全攻击出现前发现故障隐患,并提供连动的判断和处理机制,这样IT管理员可以及时采取了措施避免业务遭受损失。如果能在对问题特征自动告警的同时,自动记录问题的原始数据以供事后分析,这样IT管理员可以再现数据异常行为、捕捉网络数据异动入侵记录,对症下药制订策略防止问题的再次发生。


相关内容