网络的可靠性是设计出来的——解析网络解决方案的可靠性(1)


网络可靠性的定义

根据国家标准GB-6583的规定,产品的可靠性是指:设备在规定的条件下、在规定的时间内完成规定的功能的能力。对于网络系统的可靠性,除了耐久性外,还有容错性和可维护性方面的内容。

1、耐久性。是指设备运行的无故障性或寿命,专业名称叫MTBFMean Time Between Failure),即平均无故障时间,它是描述整个系统可靠性的重要指标。对于一个网络系统来说,MTBF是指整个网络的各组件链路、节点)不间断无故障连续运行的平均时间。

2、容错性。专业名称叫MTTRMean Time to Repair),即系统平均恢复时间,是描述整个系统容错能力的指标。对于一个网络系统来说,MTTR是指当网络中的组件出现故障时,网络从故障状态恢复到正常状态所需的平均时间。

3、可维护性。在系统发生故障后,能够很快地定位问题并通过维护排除故障,这属于事后维护;根据系统告警提前发现问题如CPU使用率过高,端口流量异常等),通过更换设备或调整网络结构来规避可能出现的故障,这属于预防维护。可维护性需要管理人员来实施,体现了管理的水平,也反映了系统可靠性的高低。

表示系统可靠性的公式为:

MTBF / ( MTBF + MTTR ) * 100%。

从公式或以看出,提高MTBF或降低MTTR都可以提高网络可靠性。造成网络不可用的因素包括:设备软硬件故障、设备间链路故障、用户误操作、网络拥塞等。针对这些因素采取措施,使网络尽量不出故障,提高网络MTBF指标,从而提升整网的可靠性水平。

然而,网络中的故障总是不可避免的,所以设计和部署从故障中快速恢复的技术、缩小MTTR指标,同样是提升网络可靠性水平的手段。

在网络架构的设计中,充分保证整网运行的可靠性是基本原则之一。网络系统可靠性设计的核心思想则是,通过合理的组网结构设计和可靠性特性应用,保证网络系统具备有效备份、自动检测和快速恢复机制,同时关注不同类型网络的适应成本。

构建可靠的网络,需要从耐久性、容错性以及可维护性三个方面进行网络规划设计。而网络的规划设计是个系统工程,不同的设计方案的可靠性性效果不尽相同,这就需要以科学的方法进行设计,构建符合需要的可靠性网络。

一、网络解决方案可靠性的设计原则

不同的网络,其可靠性的设计目标是不同的。网络解决方案的可靠性需要根据实际需求进行设计。高可靠性的网络不但涉及到网络架构、设备选型、协议选择、业务规划等技术层面的问题,还受用户现有网络状况、网络投资预算、用户管理水平等影响,因此在规划可靠性网络时需要因地制宜,综合考虑各方面的影响因素。

网络结构通常分核心层、汇聚层和接入层。网络层次越高其可靠性要求也越高。在网络的方案设计中,采用层次化的网络设计结构,不同层次解决不同级别的可靠性要求。为保证网络可靠性,可靠性技术的实施并不是简单叠加和无限制的冗余。否则,一方面会增加网络建设整体成本,另一方面还会增加管理维护的复杂度,给网络引入潜在的故障隐患。因此在进行规划时,应该根据网络结构、网络类型和网络层次,分析网络业务模型,确定基础网络拓扑,明确对网络可靠性最佳的关键节点和链路,合理规划和部署各种网络高可用技术。

在网络可靠性规划实施时,应在保证网络各层次可靠性要求的基础上,尽量降低复杂度,适度地控制成本,才能设计出最适合的方案。不能为追求单纯可靠性而忽视系统的整体成本和性能,构建可靠性网络是一个平衡各方面因素的过程。所以对于网络可靠性,没有最好的方案,只有最合适的方案。


相关内容