1、修改客户端nrpe的配置文件
nrpe文件路径:/usr/local/nagios/etc/nrpe.cfg
将配置文件中的::1换成nagios服务端的ip地址
重启nrpe
systemctl restart nrpe
2、修改服务端nagios的配置文件
文件路径:/usr/local/nagios/etc/nagios.cfg
添加hosts文件配置和services目录配置
# 新增
cfg_file=/usr/local/nagios/etc/objects/hosts.cfg
cfg_dir=/usr/local/nagios/etc/objects/services
注:
相关主要文件用途:
commands.cfg >>> 用来定义监控命令:告警通知命令、服务检测命令等;
contacts.cfg >>>联系人和组配置;
localhost.cfg >>>nagios服务端本地监控文件;
templates.cfg >>>host和service模板文件;
在/usr/local/nagios/etc/objects目录下创建hosts.cfg文件和services目录:
hosts.cfg文件用来存放被监控端主机配置;
services目录用来存放被监控端服务配置。
hosts.cfg中host定义:
define host {
use linux-server # templates.cfg 文件定义的模板
host_name 192.168.56.8
address 192.168.56.8
check_period 24x7 #检测周期
check_command check-host-alive # commands.cfg 文件中定义的命令
contact_groups dingdingalert # 联系人组,contacts.cfg文件中定义
notification_period 24x7 # 报警消息通知周期
initial_state o
check_interval 5
retry_interval 1
max_check_attempts 5
active_checks_enabled 1
passive_checks_enabled 1
obsess_over_host 1
event_handler_enabled 1
low_flap_threshold 0
high_flap_threshold 0
flap_detection_enabled 1
flap_detection_options o,d,u
freshness_threshold 0
check_freshness 0
notification_options d,u,r
notifications_enabled 1
notification_interval 30
first_notification_delay 0
stalking_options n
process_perf_data 1
retain_status_information 1
retain_nonstatus_information 1
}
具体可以看这篇文件nagios配置
services参数设置
再次提醒:
host和service模板配置都在templates.cfg文件中。
配置完nagios服务后,需要执行nagios的检测配置命令:
/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg
重启nagios
systemctl restart nagios
监控完成截图:
services:
这次文章没有涉及nagios出图,以及结合cacti的相关配置。
文章没有涉及报警的配置,包括邮件,短信,微信,钉钉,有兴趣的可以尝试。
短信和邮件报警是日常使用的。测试的过程中已经实现钉钉报警。
现在可能用nagios监控的很少了。但是个人感觉nagios的报警功能很好用,作为备用监控系统,不失为一个好的选择。
继续加油!