当前位置: 华文世界 > 数码

nagios 监控介绍及部署

2024-01-29数码

一:架构

二:NRPE 工作原理

面已经对远程Linux 主机是否存活做了监控,而判断远程机器是否存活,我们可以使用ping 工具对其监测。还有一些远程主机服务,例如ftp、ssh、http,都是对外开放的服务,即使不用Nagios,我们也可以试的出来,随便找一台机器看能不能访问这些服务就行了。但是对于像磁盘容量,cpu负载这样的「本地信息」,Nagios只能监测自己所在的主机,而对其他的机器则显得有点无能为力。毕竟没得到被控主机的适当权限是不可能得到这些信息的。为了解决这个问题,nagios有这样一个附加组件--「NRPE」,用它就可以完成对Linux 类型主机"本地信息」的监控。

NRPE 总共由两部分组成:

check_nrpe 插件,位于监控主机上

NRPE daemon,运行在远程的Linux主机上(通常就是被监控机)

按照上图,整个的监控过程如下:

当Nagios 需要监控某个远程Linux 主机的服务或者资源情况时:

Nagios 会运行check_nrpe 这个插件,告诉它要检查什么;

check_nrpe 插件会连接到远程的NRPE daemon,所用的方式是SSL;

NRPE daemon 会运行相应的Nagios 插件来执行检查;

NRPE daemon 将检查的结果返回给check_nrpe 插件,插件将其递交给nagios做处理。

注意:NRPE daemon 需要Nagios 插件安装在远程的Linux主机上,否则,daemon不能做任何的监控

三:安装部署

nagios 安装

1. yum install -y gcc glibc glibc-common gd gd-devel xinetd openssl-devel

yum -y install mysql-devel httpd php php-mysql

2.创建用户

useradd -s /sbin/nologin nagios

mkdir /usr/local/nagios

chown -R nagios.nagios /usr/local/nagios

3.编译安装

下载文件

http://sourceforge.net/projects/nagios/files/

wget http://softlayer-sng.dl.sourceforge.net/project/nagios/nagios-4.x/nagios-4.0.8/nagios-4.0.8.tar.gz

cd /usr/local/src

tar zxvf nagios-4.0.8.tar.gz

cd nagios-4.0.8

./configure --prefix=/usr/local/nagios

make all

make install

make install-init

make install-commandmode

make install-config

#添加服务

chkconfig --add nagios

chkconfig --level 35 nagios on

chkconfig --list nagios

Nagios 各个目录用途说明如下:

bin

Nagios 可执行程序所在目录

etc

Nagios 配置文件所在目录

sbin

Nagios CGI 文件所在目录,也就是执行外部命令所需文件所在的目录

share

Nagios网页文件所在的目录

libexec

Nagios 外部插件所在目录

var

Nagios 日志文件、lock 等文件所在的目录

var/archives

Nagios 日志自动归档目录

var/rw

用来存放外部命令文件的目录

4.安装nagios 插件

wget http://nagios-plugins.org/download/nagios-plugins-2.0.3.tar.gz

cd /usr/local/src

tar zxvf nagios-plugins-2.0.3.tar.gz

cd nagios-plugins-2.0.3

./configure --prefix=/usr/local/nagios

make && make install

5.安装与配置Apache和Php

Apache 和Php 不是安装nagios 所必须的,但是nagios提供了web监控界面,通过web监控界面可以清晰的看到被监控主机、资源的运行状态,因此,安装一个web服务是很必要的。

需要注意的是,nagios在nagios3.1.x版本以后,配置web监控界面时需要php的支持。这里我们下载的nagios版本为nagios-3.4.3,因此在编译安装完成apache后,还需要编译php模块,这里选取的php版本为php5.4.10。

yum -y install mysql-devel httpd php php-mysql

配置apache

vi /etc/httpd/conf/httpd.conf

User daemon Group daemon

修改为

User nagios Group nagios

然后找到

DirectoryIndex index.html

修改为

DirectoryIndex index.html index.php

接着增加如下内容:

AddType application/x-httpd-php .php

为了安全起见,一般情况下要让nagios 的web 监控页面必须经过授权才能访问,这需要增加验证配置,即在httpd.conf 文件最后添加如下信息:

#setting for nagios ScriptAlias /nagios/cgi-bin "/usr/local/nagios/sbin" <Directory "/usr/local/nagios/sbin"> AuthType Basic Options ExecCGI AllowOverride None Order allow,deny Allow from all AuthName "Nagios Access" AuthUserFile /usr/local/nagios/etc/htpasswd //用于此目录访问身份验证的文件 Require valid-user </Directory> Alias /nagios "/usr/local/nagios/share" <Directory "/usr/local/nagios/share"> AuthType Basic Options None AllowOverride None Order allow,deny Allow from all AuthName "nagios Access" AuthUserFile /usr/local/nagios/etc/htpasswd Require valid-user </Directory>

创建apache目录验证文件

在上面的配置中,指定了目录验证文件htpasswd,下面要创建这个文件:

这样就在/usr/local/nagios/etc 目录下创建了一个htpasswd 验证文件,当通过http://192.168.146.172/nagios/ 访问时就需要输入用户名和密码了。

启动apache 服务

/etc/init.d/httpd start

启动nagios 服务

service nagios start

/usr/local/nagios/bin/nagios -d /usr/local/nagios/etc/nagios.cfg

安装配置nrpe 监控本机

配置服务

vi hosts.cfg

vi services.cfg

验证配置有效性

/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

访问:

http://192.168.146.172/nagios/

#client端的,nrpe部署

在被监控机(Nagios-Linux)上

增加用户&设定密码

useradd nagios

passwd nagios

安装Nagios 插件

tar zxvf nagios-plugins-2.0.3.tar.gz

cd nagios-plugins-2.0.3

./configure --prefix=/usr/local/nagios

make && make install

这一步完成后会在/usr/local/nagios/下生成三个目录include、libexec和share。

修改目录权限

chown -R nagios.nagios /usr/local/nagios

安装nrpe

http://sourceforge.net/projects/nagios/files/

wget http://liquidtelecom.dl.sourceforge.net/project/nagios/nrpe-2.x/nrpe-2.15/nrpe-2.15.tar.gz

tar zxvf nrpe-2.15.tar.gz

cd nrpe-2.15

./configure

#如果要支持带参数,则需要加上

# ./configure --enable-command-args

make all

#安装check_nrpe 这个插件

make install-plugin

#监控机需要安装check_nrpe 这个插件,被监控机并不需要,我们在这里安装它只是为了测试目的。

#安装deamon

make install-daemon

#安装配置文件

make install-daemon-config

编辑/etc/services 文件,增加NRPE服务

nrpe 5666/tcp #nrpe

#启动nrpe 服务

/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d

将NRPE运行添加加入系统启动脚本中

echo "/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d" >> /etc/rc.d/rc.local

#测试NRPE是否则正常工作

#在监控机上执行check_nrpe ,测试被监控机的nrpe 是否正常

./check_nrpe -H 192.168.146.170

#nrpe 命令

check_nrpe –H 被监控的主机 -c 要执行的监控命令

如:

./check_nrpe -H 192.168.146.170 -c check_load

./check_nrpe -H 192.168.146.170 -c check_users

在监控主机(Nagios-Server)

安装check_nrpe 插件;

在commands.cfg 中创建check_nrpe 的命令定义,因为只有在commands.cfg 中定义过的命令才能在services.cfg 中使用;

创建对被监控主机的监控项目;

安装check_nrpe 插件

# tar zxvf nrpe-2.15.tar.gz # cd nrpe-2.15 # ./configure --enable-command-args # make all # make install-plugin

只运行这一步就行了,因为只需要check_nrpe插件。

在Nagios-Linux 上我们已经装好了nrpe,现在我们测试一下监控机使用check_nrpe 与被监控机运行的nrpe daemon之间的通信。

#nagios 增加图形化监控部署

1.nagios服务已经安装完成

2.安装rrdtool

yum -y install rrdtool*

3.安装pnp4nagios

http://sourceforge.jp/projects/sfnet_pnp4nagios/

tar zxvf pnp4nagios-0.6.25.tar.gz

cd pnp4nagios-0.6.25

安装依赖:

yum install perl-Time-HiRes

编译:

./configure --with-nagios-user=nagios --with-nagios-group=nagios --with-rrdtool

安装:

make all make install make install-webconf make install-config make install-init

cd /usr/local/pnp4nagios/etc/

cp rra.cfg-sample rra.cfg

图形配置cd /usr/local/nagios/etc/objectsvim commands.cfg# 'process-host-perfdata' command definition#注释默认的process-host-perfdata和process-service-perfdata,添加以下define command{ command_name process-service-perfdata-file command_line /bin/mv /usr/local/pnp4nagios/var/service-perfdata /usr/local/pnp4nagios/var/spool/service-perfdata.$TIMET$ }define command{ command_name process-host-perfdata-file command_line /bin/mv /usr/local/pnp4nagios/var/host-perfdata /usr/local/pnp4nagios/var/spool/host-perfdata.$TIMET$ }

#启动npcd服务

/usr/local/pnp4nagios/bin/npcd -d -f /usr/local/pnp4nagios/etc/npcd.cfg

vim /usr/local/nagios/etc/nagios.cfgprocess_performance_data=1 service_perfdata_file=/usr/local/pnp4nagios/var/service-perfdata service_perfdata_file_template=DATATYPE::SERVICEPERFDATA\tTIMET::$TIMET$\tHOSTNAME::$HOSTNAME$\tSERVICEDESC::$SERVICEDESC$\tSERVICEPERFDATA::$SERVICEPERFDATA$\tSERVICECHECKCOMMAND::$SERVICECHECKCOMMAND$\tHOSTSTATE::$HOSTSTATE$\tHOSTSTATETYPE::$HOSTSTATETYPE$\tSERVICESTATE::$SERVICESTATE$\tSERVICESTATETYPE::$SERVICESTATETYPE$ service_perfdata_file_mode=a service_perfdata_file_processing_interval=15 service_perfdata_file_processing_command=process-service-perfdata-file host_perfdata_file=/usr/local/pnp4nagios/var/host-perfdata host_perfdata_file_template=DATATYPE::HOSTPERFDATA\tTIMET::$TIMET$\tHOSTNAME::$HOSTNAME$\tHOSTPERFDATA::$HOSTPERFDATA$\tHOSTCHECKCOMMAND::$HOSTCHECKCOMMAND$\tHOSTSTATE::$HOSTSTATE$\tHOSTSTATETYPE::$HOSTSTATETYPE$ host_perfdata_file_mode=a host_perfdata_file_processing_interval=15 host_perfdata_file_processing_command=process-host-perfdata-filevim localhost.cfg define host{use linux-server,host-pnp #修改这里host_name localhostalias localhostaddress 127.0.0.1}define service{uselocal-service,service-pnp #需要画图的都加上service-pnp host_name localhostservice_description PINGcheck_command check_ping!100.0,20%!500.0,60%}vim templates.cfgdefine host{name host-pnpregister 0action_url /pnp4nagios/graph?host=$HOSTNAME$&srv=_HOST_process_perf_data 1}define service{name service-pnpregister 0action_url /pnp4nagios/graph?host=$HOSTNAME$&srv=$SERVICEDESC$ process_perf_data 1}/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

配置权限

chown -R nagios.nagios pnp4nagios

修改/etc/httpd.conf文件,添加

include "/etc/httpd/conf.d/pnp4nagios.conf"

修改etc/httpd/conf.d/pnp4nagios.conf

AuthUserFile /usr/local/nagios/etc/htpasswd.users

为:

AuthUserFile /usr/local/nagios/etc/htpasswd

service nagios restart

service httpd restart

点击图形后,如果访问支持

再删除

/usr/local/pnp4nagios/share/install.php

确认/var/lib/php/session 权限足够

choown apache.nagios

如果需要在nagios页面即可查看到动态曲线那么需要做如下改动:

cp /usr/local/src/pnp4nagios-0.6.25/contrib/ssi/status-header.ssi /usr/local/nagios/share/ssi/status-header.ssi

vim /usr/local/nagios/etc/objects/templates.cfg

生成的rrd文件在此目录/usr/local/pnp4nagios/var/perfdata/localhost

如果因为网络不稳定导致出图问题,可以修改一下超时时间

vim /usr/local/pnp4nagios/etc/process_perfdata.cfg

TIMEOUT = 30 #默认是15秒