二、 OVOP (OpenView Operations&Performance) & SPI

惠普的 OVO 软件,是一个综合的故障管理平台,它主要负责系统级的管理,包括各种异构的服务器和工作站 UNIX,NT ……)。

hp OpenView Operations 提供由业务驱动的方法,能快速控制电子化服务。它属于分布式大型管理解决方案,能监视、控制和报告 IT 环境的状态,因而能延长组成电子企业环境的各个部分的正常运行时间:网络、系统、数据库、应用、服务和 Internet 。

主要功能有:

系统事件监控、故障管理

OVO 采用 Manager/Agent 结构。管理员能够从 Manager 端完成所有管理工作,同时大部分管理任务在 Agent 端执行,即集中控制 / 分布执行模式。

名词:

Manager : OVO 的管理端,安装在管理工作站。管理员能够从 Manager 管理平台定义 Template ,并定义 Agent 和 Template 的分发。

Agent : OVO 的智能代理,安装在被管服务器。 Agent 接收从 Manager 端分发的 Template ,并执行 Template 中定义的管理策略。 Agent 的安装工作能够从 Manager 端进行远程安装。

Template : 对被管节点进行管理时所执行的策略。 Template 在 Manager 端定义并分发到 Agent 端,之后被 Agent 执行。

采用 Manager/Agent 结构,管理员能够对企业网络环境中的服务器进行集中的系统管理,从管理工作站完成所有管理工作。 Agent 能够根据 Template 自主执行管理策略,将大部分管理任务在本地执行,同时将重要事件传送到 Manager 端,从而有效地减少网络负载。当网络出现故障时, Agent 也能够继续执行管理任务。

系统运行状态的变化最终都将通过事件表示。 OVO 能够自动收集网络中的各种系统事件,并集中到 Manager 端的事件控制台中。所有事件均被标定一定的严重级别。相关事件能够被分在一组,帮助管理员进行分析和处理。对采集的事件按来源、类型、级别、门限阈值等指标进行分析,然 后把结果传送到上级管理台,以实现事件的集中监控。

OVO 所收集的事件能够提供给 Reporter ,形成系统故障报告,供管理员进行分析和统计。

OVO 能够根据用户的配置自动轮询网络中各被管服务器的系统参数,包括:网络设备、操作系统、数据库、应用程序产生的日志;各种 Unix 程序、脚本产生的信息;各种设备发生的 SNMP Trap 。对每个被管系统的参数收集内容、轮询间隔等均可以由管理员通过 Template 进行定制。

OVO 允许管理员对收集的参数设置阈值。当发现系统运行中的异常状况,如被监测的参数超出阈值时,能够自动生成告警事件, Agent 能够自动向管理员进行告警,告警方式包括屏幕弹出对话框、电子邮件、 e-mail 、声音等。同时, Agent 也能够根据策略自动执行纠正动作,一些故障能够被自动处理,而不需要管理员的干预。

OVO 的主动管理能够预先发现故障征兆,并在系统故障对用户的关键应用产生影响前提示管理员解决问题。

系统性能监控

OVO 提供对网络设备、操作系统、应用软件的性能监控,可以采集广泛的资源和性能测量数据。包括: CPU 利用率、系统和用户进程、 I/O 占用的 CPU 时间、交换空间 (Swap) 的使用情况、磁盘阵列使用情况。并且对这些监控指标可以阈值, Agent 能将实时性能值与可定制的指标阈值比较,产生性能告警。

OVP 由 PerfView 和 Performance Agent 组成。通过 Performance Agent 收集到关键系统的性能数据,进行时间标记、日志记录和产生报警,然后将这些数据传递给 PerfView 进行集中分析、处理、图形显示及趋势预测等。同时允许管理员事先定义好性能阈值,对于资源的过高或过低使用予以记录,在超过警线时提醒操作人员注意或执行自动动作。使用 PerfView 这一强有力的性能管理工具,管理人员可以得到整个网络系统和其中的关键节点在一段时期内的运行情况,进一步分析当前系统能否满足业务处理的要求,从而产生系统的升级、扩展的策略和方法。

SPI

惠普 OpenView SPI 智能插件)是 OVO 的功能扩展,它可以为用户提供应用层的定制管理。作为 OVO 的智能插件, SPI 是不能独立安装的,它需要有 OVO 作为基础平台。他的主要功能是利用预先定制的模板 , 对特定的应用、服务进行监控,比如 Oracle,SAP,BEA ……


相关内容