网络管理: 分还是合(1)
网络管理: 分还是合(1)
分布式网络管理
如今,服务于企业自身业务发展的自主网络体系日益扩张,结构更加复杂,呈现出地理分布广、接入方式多、对网络性能要求高等多层次化需求。
如果整个网络的运行过度依赖于一个网管中心,那么,一旦网管中心发生故障就容易导致整个网络管理的无序,甚至瘫痪。所以,这种过度集中式网络管理的模式不适于对大规模网络进行实时性要求较高的监控与管理。在这种大背景下,网络管理的层次化分布部署势在必行。
分担负载 明晰责权
大型行业均以省、市、地州或行政大区划定了与其业务特性相符的配套网络架构和管理体系。在这种多分布、逻辑架构复杂,且广域特性涉及BGP(边界网关协议)、OSPF(开放式最短路径优先)、多域、单域等多种环境下,要想在单个管理中心实现有效的监控,是不太现实的。数据采样间隔过大时,不能实时反映性能数据的变化趋势,并及时做出应有的反应; 相反,采样间隔过小,面对大型、复杂的网络又会造成管理信息的交换消耗大量的带宽和计算资源,成为系统的I/O瓶颈,造成存储空间的急速增加。例如,在某行业的大型网络实际运维中,用户发现采样间隔由10分钟变为5分钟后,数据量每天递增了20GB。
因此,依据行业的业务特点和网点的分布情况,CIO需考虑地理环境的优势、运维人员的技术支持能力、网络链路资源及机房场地、交通便利条件等诸多因素,选择与企业业务规模相对称的区域级别的网络运维管理中心。各分支机构依据就近接入、统一管理的原则接入网络运维管理中心。这样大量节省了长途链路的资费,提高了相应的互连带宽,各分支机构也有了技术支持后盾。
由于这种网络管理的层次化划分,加上软件产品对分布式部署的支持,可以有效地将事件和性能数据过滤和归并,通过制定一定的管理策略,把有限的管理信息用于向总运维调控中心汇聚。这样,各区域网络运维中心有效地分担了网络管理对细节因素的追踪,同时又能使总运维调控中心具备宏观的视野,从而顾全整个业务体系的正常运转。
从单一的集中式管理走向层次化分级管理是网络管理发展的一大进步,大型网络从一个大的星形结构逐步过渡到层次化星形结构(树形结构),甚至网状结构,其优势是非常明显的。层次化管理模式明确了运维管理的关注点和与之相应的职责,网络有广域、局域之分,那么管理也必定有差异。
采购分布式网管系统
五项注意
在大型行业的运维管理中,运维管理中心往往设立在总部机关所在地,其运维重点在于关注广域链路的通断、长途链路利用率、双链路负载均衡、路由抖动、时延等保证关键业务全网通达的技术参数性能。而各分支机构的日常运维事项又与楼层交换、用户终端、网内异常流量审计等内容密切相关。那些诸如楼层交换设备、用户端故障、局域网内流量异常、病毒局部侵扰等并非广域运维关心的重点。因此,合理的层次化分级管理会有效地处理好这种管理范围和职责的划分。利用现今网络管理软件对分布式部署的全方位支持,管理员可在局域范围内把网管工作做细,也可通过过滤策略把关键信息上传到运维管理中心,从而把控全网细枝末节的网络健康状态,保证关键业务的顺畅运行。这种分级化管理的方案选型应关注如下几点。
◆ 分布式网管在分支机构进行部署时,不宜求全求大,宜求精求实,最好采用统一的系统平台, 避免各自为政采购大型软件,最后因无实施能力导致搁置。在实际情况中我们不难发现,由于网络建设并非同步进行,而且缺乏统一的实施标准,许多信息部门虽然很有预见性地采购了网络管理配套软件,但由于未考虑它的实施难度和基层技术人员的运维技术水平,导致采购的大型网管软件并不能发挥其产品宣传所能达到的实际运维功能。所以应在一个大的整体策略下,通过集中评测甄选适合本企业统一部署实施的管理软件。
◆ 应加强基层技术人员的技术和管理策略培训,并同步进行配套管理策略和制度建设。通过标准化的流程策略和相关制度约束,保证网管策略自上向下地有效贯彻。
◆ 企业采购的软件无论是商品化软件或者自主二次开发的平台,应考虑支持分布部署策略和事件上传过滤、归并机制。实际网管实施过程中,告警事件不是报不出来,而是报得太多,“狼来了”喊多了就没人相信了。这在采用了邮件、短信、声、光、电等多种报警模式的情况下尤显突出。做好告警事件的有效归并,不但能减少告警事件量,而且便于故障根源的快速判断和响应。
◆ 总运维控制中心应具备基于业务视角的监控运维管理手段。依据关键业务的特性将相关监控管理技术指标用一个维度综合计量,加快故障根源的快速定位与分析,规避“眉毛胡子一把抓”的无序状态; 也能有效避免出现业务故障时,相互推诿责任的现象。
◆ 配套行政手段需落实到位,仅靠单纯的技术手段,管理策略并不能完全落实。需建立有效的机制,落实督促管理策略。分布式管理,并不意味着放任自流,而是要通过有效的机制使网络管理工作更加有效。
在规模不是很大、网上业务应用不是很多的企事业单位,可采用分布式管理模式,在数据采集的及时性、技术细节的把控和响应上都会有较好的保证,而且能起到相互冗余的作用。
评论暂时关闭