系统管理员神器 monit 监控报警设置方法,它可以自动修复那些已


Monit 是一款功能非常丰富的进程、文件、目录和设备的监测软件,用于Unix平台。它可以自动修复那些已经停止运作的程序,特使适合处理那些由于多种原因导致的软件错误。

Monit 对管理员来说可谓神器也。话说 Nagios 也就是在监控牛,而 Monit 不但本地监控牛,远程服务监控也牛。更牛的是,只要你花点功夫,你的服务就永远都能“死而复生”。

安装

CentOS

yum install monit

Ubuntu:

apt-get install monit

使用

配置文件在 /etc/monit.conf

配置发邮件的smtp服务器

set mailserver 111.111.111.111 USERNAME "xxx@xiaomi.com" PASSWORD "54chen54chen"

配置服务检测的周期

set daemon 30
30秒检查一次

配置报警邮件格式

set mail-format {
from: ALERT
subject: $service $EVENT at $date
message: Monit $ACTION $SERVICE at $DATE on $host: $DESCRIPTION.
}

配置收报警的人

set alert 54chen@xiaomi.com with reminder on 3 cycles ;出问题时最多连续报3次

配置监控对象

check host webim-91 with address 192.168.1.2
if failed host www.miliao.com port 80 proto http and request "/test.html" for 2 times within 2 cycles then alert

其他

可以监控的类型有: CHECK PROCESS file FIFO DEVICE DIRECTORY HOST SYSTEM

帮助

man monit

相关内容