主动管理,构筑电力行业高效网管模式


随着电力行业信息化建设的不断深入,IT管理需求逐年递增。电力行业IT产业集群按照信息化专业程度或行业特征)主要划分为电力控管自动化、电力调度信息化、电力市场、电力营销和通用IT应用等几个部分。电力控管自动化以电力自动化专业设备、工业控制软件为主;电力调度信息化主要是通讯数据网的建设;电力营销和通用IT应用则是以软件应用为主。

在发电行业IT运维管理中,缺少有效的管理手段和方法,使得来电响应式的管理成为发电企业信息网络管理的实质。从用户的角度讲,故障处理时间长,故障次数频繁,难以使用户对信息中心的服务有足够的信心和好感;从系统监控的角度讲,不论是设备还是业务运行状态均不能得到有效的监控,以至于运维人员无法全面了解IT系统的实时运行状态;从运营管理的角度讲,落后的IT管理手段导致繁重的工作量和低下的维护水平,既不利于运维人员技术素质的提高,也不利于电力企业提高业务服务质量、降低维护成本。

针对发电企业网络综合管理及系统管理的弊端与不足,建设一套全面覆盖IT基础设施的综合IT运维管理系统, 有力保障网络系统的稳定可靠运行,对于提升当前发电企业的信息化管理水平是非常及时和必要的。

用户需求

新乡豫新发电有限责任公司局域网1997年开始规划,1998年网络建成,由北京国都公司承建。2007年1月1日,两台200MW机组被新中益公司直管后,随资产的划分,原网络系统划归新中益公司,豫新发电公司网络另行新建。新的网络系统覆盖行政办公楼、生产办公楼、综合检修办公楼、三产多经楼、修造公司、汽机检修、电气检修、锅炉检修、化学分场、物资公司、135MW技改楼、135MW机组集控室、300MW机组集控室、燃料部等十余幢建筑,接入计算机400多台。

网络中心机房位于行政办公楼12楼,一台PCM在线式30KVA UPS和为机房供电。从信息中心到各楼宇采用单模光纤主干布线,楼内采用非屏蔽5类双绞线布线。总光纤布线近6000米,双绞线3万余米。总信息点700余点,满足将来网络扩展的要求。

此外,电厂内部是采用局域网技术进行网络互联,在与各上下级单位、合作单位采用外联网Extranet)技术进行分级管理控制与信息的有限共享,而电厂对外接入互联网,在互联网上进行窗口宣传。由上述资料可以看出,豫新发电公司的网络层次繁多,子网与主机数量庞大,必须经过非常严密的分析才可提供整体的信息网络运维管理解决方案。

具体的需求包括以下几个方面:

一、由于信息系统网络大多已经建立完整,网络拓扑结构也已经确定,所以安全、经济的整体网络管理运维解决方案的实施应以尽量不修改原网络拓扑结构为前提。

二、跨平台监测——从Windows环境下可以对NT, Unix,Solaris,AIX,FreeBSD,Unixware,HPUX,OpenServer, Linux等不同平台的服务器进行远程监测,对于暂不支持的操作系统还可根据用户需求进行二次开发。

三、高可扩展性——根据发电行业不同的网管系统,监测参数的数量可根据需求任意增减伴,随企业需求的变化与企业一同成长。一般应支持业界通用的协议和技术,这些公司包括 Microsoft、Oracle、SQLServer等。

四、远程监测——由于电力行业的网络覆盖区域广泛,事事需要网管人员亲历亲为是不现实的。通过网管系统,网管人员就可以远程对网络系统进行维护和管理,通过各种警报方式、拓扑图颜色的变化以及报表数据等方式,及时了解系统的性能和运行状况。

五、灵活的预警机制——网管维护人员可以根据日常运维经验,对系统的相关性能进行阀值设置,一旦网管系统采集到的参数达到网管人员定义内的阀值,警报系统就会及时通过各种方式发出预警,从而帮助电力行业的网管人员及时发行故障因患,避免电力运营中损失的发生。

网络运维管理方案实施

新乡电厂拓扑图

在比较了多种方案之后,豫新发电公司最终选择了北塔网络公司提供的整体IT运维管理解决方案。在公司中心机房运行Windows 2000Server的服务器上安装北塔网络运维管理系统(Before Trobule Network Manager,下面简称BTNM),并在各管理员计算机上安装其远程管理客户端,以实现统一平台、统一管理的目的。在此基础上,北塔网络运维管理较好完成了豫新发电公司对网络运行维护的管理要求。 主要表现为:

一、一目了然的物理拓扑结构图。北塔网络运维管理系统提供用户真实精确的网络物理拓扑图,直观的显示出豫新发电公司多台设备之间复杂的物理连接关系、连结线路信息和设备的工作情况。并在此基础上提供IP定位查找功能,使管理员对网络整体工作情况做到一目了然、心中有数。

二、快速精确的故障告警信息。BTNM对所有故障均能在很短时间内发出告警信息,这种迅速响应机制与网络规模无关,所以在豫新发电公司的网络中,总是让管理员在第一时间得到告警信息,体现出了快速精确的特性。同时,它还可提供包括EMAIL、语音、语音电话、BP机、弹出窗口等多种告警手段,使网络管理员不论身处何处不论白天黑夜都可以迅速得到网络故障信息。

三、跨厂商的管理平台。BTNM很好的适应了豫新发电公司系统的跨厂商网络平台,对CISCO、JUNIPER等产品都提供了完美的设备视图和足够的配置管理功能,使豫新发电公司能用一个平台管理所有设备和所有主要应用。

四、丰富实用的管理工具。BTNM集成了许多对网络管理员非常实用的工具,包括:网络运行情况记录和分析、应用监视和分析、测试指定网络段的延迟、拨号审计、IP流量审计、网络设备SNMP信息浏览、Telnet、ping、trace route等。

五、针对网络运行情况、用户体验进行分析。对豫新发电公司来说,除了实时的关心网络运行情况以外,还希望在事后对网络运行情况有一个全面详细的分析,并对网络使用趋势做出估计。另外,公司信息部门还不仅关心网络情况,更加关心运行在网络上的应用服务的情况。北塔网络资源管理系统在经过用户设置之后,会自动关心并记录指定设备的负载、端口流量、主机端口响应情况,甚至模拟用户操作,记录特定应用服务的响应情况,并允许用户生成html格式的总分析报告、详细报告和大量图表,供用户参考。

六、操作简变和数据表现。与许多同类产品不同,BTNM针对的对象通常是非专业技术人员的最终用户,他们的特点是关心应用服务,关心网络数据对他们的应用而言究竟意味着什么。所以,北塔网络运维管理系统致力于对大量数据进行提炼,找出对用户最有意义的部分,或对数据进行聚合后再展现给用户。在豫新发电公司的应用中,系统通过网络分析最终给出网络设备的实际可用性参数,对用户来说,比厂商给出的参数更有实际意义。

用户反馈

1)BTNM网络运维管理系统能够采用多种算法、迅速搜索整个网络内的所有节点、自动勾画出整个网络的准确第2层拓扑图――物理拓扑图,包括设备间的冗余连接、备份连接、均衡负载连接等管理员关心的关键问题在一个拓扑图上直观展现,动态实时反映的网络布线信息,设备运行状态及链路的流量变化情况等,使管理员轻松掌握整个网络系统的运行状况,并为管理员解决信息分布不均衡问题,优化网络结构提供了第1手资料。

2)使用BTNM之前,管理员总是通过用户打电话报告等方式被动的收到故障信息,许多小故障不能及时处理,最终累积成网络事故,造成大面积信息中断等严重后果。
BTNM提供了从网络的第2层到第7层实施全面的故障告警管理,每种告警能够进行详细的告警设置和不同的告警通知方式。通过制定的策略,运维系统实现了对重要网络设备中断、重要服务端口down等故障及时的短信告警,管理员可以在最短的时间内发现并解决问题,提高了故障响应效率,最大程度的保障了网络系统运行安全,受到用户好评。

3)以往管理员查询某台故障计算机位置需要花费较长时间,还要查找资料,非常不方便,对IP地址篡改等行为不能及时发现和控制,用户意见较大。
由于BTNM提供了详细的IP地址簿功能,配合安全管理,BTNM网络运维管理专家能够监控全网IP定位、MAC定位。管理员根据IP地址准确的定位此IP地址所对应的网络设备或PC的位置,此位置可以精确到它所直接连接的设备端口。同时还提供全网IP/MAC地址绑定监查,全网主机、PC、设备网络连接位置变动侦测,捕捉地址盗用及非法设备移动。IP定位等功能可以将有问题的机器如中病毒的机器快速定位到交换机的端口上,并通过直观的交换机面版图对该端口进行关闭、开启操作,极大提高了管理员工作效率。

相关内容