通过提交脚本捕获错误

下面举例说明JUNOS提交脚本能够捕获的潜在错误:

基本状态测试:确保不会意外删除编辑接口和编辑协议。

一致性检查:确保您在编辑层配置的每个T1接口同时也在编辑协议层得到配置。

接口密度:确保不在信道化接口上配置过多的通道。

链路扩展:确保SONET/SDH接口的MTU规模永远不会低于某个值,如4千字节。

输入策略检查:确保IGP不使用输入整个路由表的输入策略。

交叉协议检查:确保基于LDP的所有接口都配置用于内部网关协议(IGP),或者确保基于IGP的所有接口都配置用于LDP。

除发送警告消息或拒绝提交活动外,脚本还能修改或扩展配置。您可将所需的一组基本变量扩展到整个复杂配置中,从而确保跨越多个产品提供一致性。所有这些功能都使用XML文件和命令格式,因此具备开放性及可扩展性,能够与客户及第三方应用互操作。

在脚本运行之后、验证好的配置被激活之前,JUNOS软件将拷贝正在运行的配置,并将其保存在能够容纳50个先前配置的档案中。JUNOS软件还提供可选的确认工具。开启后,路由器要求在新配置被激活后的特定时段内运行确认命令。如果路由器没有接到确认消息,将自动重新激活以前的配置。管理员也可通过回退命令手动重新激活档案中保存的任何配置,快速恢复到最初工作状态。

抢先发现轻微错误,防止它们演变成重大错误错误的层叠效应是复杂系统的主要特征之一。小问题可快速演变成重大问题。因此,JUNOS运行脚本允许网络工程师自动实施早期警告系统,以便检测出新问题,采取适当措施来避免问题激化,并使系统快速恢复正常运行,而不是坐等小问题演变成大问题,触发警报并向网络操作人员发出通知。

运行脚本与提交脚本使用相同的软件机制,但由系统日志事件触发,不是由配置提交事件触发。运行脚本也可定期运行,对状态指示器、网络连接和其他状态指示器进行检查。当脚本检测出CPU利用率过高或者存在被丢弃的虚拟专网(VPN)连接等潜在问题时,将会采取一系列措施,如发送通知、检查其他状态指示器以及关闭低优先级程序等,甚至能够更改路由器配置。运行脚本也可填充特定的MIB变量,允许它们与SNMP管理系统协作,从而对特定产品实施粒度更细的监控,而不是在整个系统上使用通用的阈值。

JUNOS脚本中包含由不同的事件策略所驱动的大量潜在条件。If-then-else构造允许它们摆脱简单的被动响应机制,被特定条件触发后,脚本将对其他的状态指示器和变量进行评估、向操作人员发送高级通知、甚至采取适当行动。这些早期警报使网络操作人员能够更自信地诊断和解决新出现的问题,从而帮助缩短网络故障中断时间。

最大限度地延长运行时间

JUNOScript Automation提供灵活的脚本编制功能,允许客户通过配置的定制验证、故障排除以及特定条件的自动响应机制来提高网络运行效率。这项功能允许用户诊断网络故障中断的原因并据此编制脚本,以防此类故障再次出现或者在逐渐缩短故障持续时间,从而做到持续改进。

JUNOS工具包中的这些新工具如何影响网络故障中断?随着脚本库的构建以及在组织内外部的共享,网络故障中断将得到大幅度改进。与此同时,Lake Partners Strategy Consultants近期开展的调查也揭示了避免网络故障中断的某些潜在因素。

Lake Partners采访了122名客户,旨在了解他们在网络中部署的产品类型、所用的操作系统以及具体的网络运行行为。调查发现,路由器对网络运行时间的作用最大,但存在较大差异,具体取决于操作系统。

下面,我们来具体介绍Lake Partner调查中涉及到的运行任务。监控网络状态和产品参数的操作约占总体操作时间的20%。据回答人报告,运行JUNOS软件的网络产品所需的监控时间比其他软件短25%。构建运行脚本能够进一步自动执行重复的监控任务,从而进一步减少监控活动。

据回答人称,故障排除操作的时间占所有核心路由操作的21%。据调查,JUNOS软件的一致性和模块性能够将故障排除时间和意外事件的发生频率降低54%。早期警告脚本以

及对已知事件的一致响应(如CPU使用高峰或VPN故障)能够进一步缩短故障排除时间,并降低意外事件的发生几率。

参加调查人员还报告说,与其他软件相比,在网络设备上运行JUNOS软件将意外事件的频率平均降低了24%,并将故障持续时间平均缩短了30%。用于配置变化和轻松回退到原有配置状态的提交程序功不可没。JUNOS脚本的增强功能可进一步减少意外事件的频率并缩短故障持续时间。提交脚本能够根据网络策略验证配置变化并且跨越多个产品将一系列关键输入一致地扩展到复杂的配置命令中,从而大幅度减少因人为错误导致的意外事件的数量。

JUNOS软件对意外事件的频率和持续时间的影响

表1:JUNOS软件对意外事件的频率和持续时间的影响(Lake Partners, 2007)

“JUNOS的模块性确实能够起到帮助作用……瞻博网络允许系统持续运行,不受操作的影响。”

——Lake Partners培训部IT总监《操作系统如何提高网络效率》,2007年。

总结

网络的覆盖范围和速度都在不断提升,从而扩大了网络故障中断的影响。鉴于人为因素是导致网络故障中断的主要原因,因此,从人为错误中吸取经验教训并提高复杂网络的管理能力将有助于大幅度提高网络可用性。

JUNOS软件采用模块化设计并遵循严格的开发流程,为您持续改进系统方法,在复杂的网络中考虑人为因素奠定坚实基础。最新的JUNOScript Automation功能便是在这个基础上构建的。企业和电信运营商可利用资深员工捕获信息,并通过对以前的故障实施根源分析来开发脚本,用于降低故障的重复发生率。早期警告脚本能够及早捕获轻微问题,以防它们演变成严重问题,并使网络操作人员能够有更充裕的时间通过更多的选项来响应问题,从而有效降低网络故障中断的发生频率并缩短持续时间。企业和电信运营商可利用这些经验的积累来编制脚本库,从而自动检测并解决问题。缩短网络的监控和故障排除时间允许企业和电信运营商将更多时间用在有助于提高竞争力的战略性创新活动上。

随着企业将不断积累的网络经验转变成脚本,他们将能够与其他企业交换知识或者利用其他企业积累的专用或通用脚本库。网络操作人员将不再受限于公司内部知识,而是能够利用更广泛的大社区来获取优势。基于JUNOS平台的网络将迎来网络运行时间的持续改进周期,满足高绩效企业对高性能网络的需求。

  1. 专题:网络访问中断大排查
  2. 网络故障诊断和排除


相关内容