二、IP数据网综合网管系统的基本框架和分类介绍

与传统的IP网管系统一样,综合网管系统主要由五大部分组成:配置管理、性能管理、故障管理、业务管理和安全管理。

1.配置管理

配置管理功能主要负责全面动态地管理全网所有网元设备的配置数据、设备保障、状态检查和安装功能,能够以图形、文字等形式分层显示配置相关的各类信息,并且具有编辑(增加、删除、更改)、分类统计和打印输出这些数据的功能。

设备配置数据包括系统内各网元生成的设备配置参数,也包括根据设计文件及管理资料人工生成的参数两部分内容。对配置数据的管理包括配置文件的生产和获取,配置文件的维护和编辑,制定配置计划,进行配置校验和配置结果模拟并使配置生效等。用于配置管理的软件主要有针对Cisco设备的Cisco Netsys Baseliner、CWSI、ACL Manager(其中后两者包括在CiscoWorks2000网管工具集当中);HP OpenView网管平台也提供了相应的功能模块支持配置管理,OpenView的NNM(Network Node Manager)可以自动发现网络节点,生产网络拓扑图,并对各种网络事件进行处理。

综合网管系统的配置管理系统由四个部分组成:网元管理平台、基本配置管理、高级配置管理、用户公共接口。网元管理平台一般是设备厂商提供的设备管理平台,负责与设备直接通讯,基本配置和高级配置管理完成配置功能,用户公共接口不仅提供用户访问管理功能的接口,同时还提供与其他管理功能的接口。

在配置管理中,通过网络拓扑图,网管人员可以对整个网络结构有形象地了解,设备配置信息和网络流量报警也可在拓扑图上直观地显示。为此,研发人员在汲取NNM在拓扑显示方面的优点后,基于JAVA语言自行开发了CHINANET骨干网网络拓扑显示功能模块。除对网络设备可进行拓扑发现外,该模块还可分层(骨干网分全国和八大区两层)显示网络拓扑,对网络设备和链路配置信息进行查询,实现拓扑图上的流量报警,并针对骨干网网管的特殊需求,实现了实时路由监测和ISIS路由仿真功能,这对骨干网网络优化和发展建设具有指导作用。该功能模块实现了Web化,在权限许可范围内通过浏览器访问APPLET的方式即可进行。

系统可以基于HP NNM提取的管理信息生产网络拓扑,也可通过SNMP协议直接从骨干网设备的Agent中取得所需的MIB信息并存入数据库。后一种数据采集方式有利于采集数据的维护,基于定制的新功能的开发,并且免去了与NNM的数据接口。由于是“按需而取”,采集的数据量很小,不会造成网络资源的浪费。

2.性能管理

性能管理主要负责全网性能监视、性能控制和性能分析,完成链路性能测试以及各类性能信息的收集、统计、存储,同时还负责性能信息数据库的维护,性能管理阈值的设置与阈值越过报告,产生按需的性能报告,系统基于性能报告和统计分析,通过运行管理功能和配置管理功能对网络进行调整,以达到改善网络总体性能水平的目的。性能管理功能包括数据信息采集、性能信息的统计和存储、性能管理阈值处理和性能报告生产等部分。研发人员采取的实现方案是:自主开发和与第三方软件相结合,自主开发的软件通过第三方接口来获取信息,并对信息进行再加工分析、提取、归类、统计以及与其他管理模块进行信息交互,对网络进行实时动态监控并获取相应性能参数,及时地与其他模块互动。

性能管理系统通过Cisco NetFlow软件,采集路由器各端口基于QoS 级的数据流,捕获每个网络流量的分类和优先权,在服务质量的基础上区分数据流并加以处理,生产相应报表。NetFlow采集数据还可用于平衡网络的负载,查找网络的故障,优化网络的性能以及SLA吞吐量监测和基于数据流的计费等方面。

系统用Cisco IPM(Internet Performance Managerment)软件,通过发送echo、pathecho数据包测定网络的响应时间,进而可以采集网络时延、丢包率和抖动等网络性能参数,生产反映网络服务质量的报告,指导网管人员使用相应的QoS策略,实现对企业用户的SLA管理。

基于HP OpenView的NetMetrix、Network Hearth/Concord等软件,系统可以发现并隔离网络故障,反映网络性能趋势,监测网络资源和性能,测定流量峰值并产生相应报表。

3.故障/告警管理

故障/告警管理实现对数据网内所有网元设备的告警监测和故障定位,配合运行管理功能进行故障排除和系统设备复测,还能收集和处理各网络单元(NE)的各种故障、告警及网络状态异常信息,并具有各种分类统计和指导分析的功能。

告警/故障管理主要包括以下内容:告警数据的采集和存储、定制告警分类和级别、告警数据过滤和相关性分析、告警的实时显示和生成报表、告警/故障处理、告警/故障数据库的维护以及与知识库系统的接口等。故障/告警管理以工作流的方式,提供了网管的自动化功能,通过一系列的工具和接口,帮助系统人员完成日常维护和管理工作。本系统中常见的工作流为值班日志和故障工作流。

该系统作为网管系统功能中最重要的一部分,对故障和告警管理功能的要求非常细致,有多种第三方软件提供故障管理功能,并且在实现功能上各有侧重。为开发综合的故障和告警管理系统,研发人员的任务主要是对各种第三方软件在功能实现、体系结构、扩展性和灵活性、再开发性和售后服务等方面经过对比,采用自主开发和三方软件相结合的解决方案,在选定的第三方软件的故障管理平台上,利用其采集的数据进行综合处理与再分析,并基于用户提出的特殊需求开发定制的功能模块。自主开发软件的功能侧重于与第三方软件的无缝集成。

在CHINANET骨干网网管项目的告警/故障管理模块中,研发人员选取Micromuse/Netcool作为主要的故障管理平台,HP OpenView NNM 作为其补充,自主开发软件完成可定制的管理界面的生成、基于工作流的故障发现、工作流程设计、与其他管理模块间的接口与互动、在网络拓扑图上的链路故障/告警显示以及故障/告警解决知识库的维护等。

4.业务管理

该系统应实现基于应用/服务的网络管理,向网管人员明确反映网络的实时质量状况,为网络规划提供信息,并能提供有区别的服务,针对用户需求,特别是按照企业大用户的需求,提供基于QoS的服务级别协议(SLA)、计费等功能。综合网管系统对业务管理的功能划分以及与其它管理模块的集成进行了大量的研究,提出的解决方案如下:

对于网络的服务质量,使用Cisco的IPM软件,对骨干网中的Cisco设备收集相关数据,经分析处理可以获得反映网络QoS的时延、丢包率、网络吞吐量等参数,进而生成QoS性能评价报告;

对于应用的服务质量,基于Netcool的ISM软件,可以对多达18种应用层协议(包括DHCP, DNS, FTP, HTTP, RADIUS, POP3, SMTP等)的服务质量进行监视,并生成性能报告;相同的功能也可由自行开发的软件,完全按照用户的定制来实现;

针对IP网的特殊应用服务(如VPN、VoIP、线路租用等),使用直接针对该项业务的QoS监测管理软件,可以获得更详细的QoS数据,有效地保证SLA管理水平。

5.安全管理

安全管理对全网安全起保证作用,主要功能包括:权限管理功能、数据安全管理以及安全检测功能。作为网络管理的基本功能之一,安全管理通过控制信息访问点来保护网络中的敏感信息。在设计过程中,应充分考虑保护敏感信息和允许网管人员访问适当信息以进行工作这两方面的需要,合理设置安全措施来保证系统和数据的安全。此外,对某些关键设计信息,如用户密码等,还应提供加密传输和存储功能以加强保护。研发人员采取的解决方案是RADUIS+TACACS。


相关内容