天天看點

HPUX安裝nagios監控插件(NRPE)難點解析

HPUX上安裝NRPE,特别是在監控ORACLE資料庫有一些疑難的點,自己一邊摸索一邊整理了出來,就當是做個備忘

一、下載下傳預編譯好的depot源碼包

網址:http://www.mayoxide.com/naghpux

包名:NRPE-2.12.depot.gz

可能還需要另外兩個包的支援,如果作業系統沒有安裝,也請下載下傳:

openssl-1.0.1f-ia64-11.31.depot.gz

tcp_wrappers-7.6-ia64-11.31.depot.gz

二、建立NRPE使用者

groupadd -g 312 nrpe

useradd -g nrpe -G oinstall -u 312 nrpe  (注:之是以添加到oinstall組,是使其具備執行oracle插件的權限)

三、HPUX上安裝NRPE

swinstall -s /tmp/NRPE-2.12.depot.gz

swlist -l product | grep NRPE

四、将NRPE配置為inetd管理程序

/opt/nrpe/bin/configure.sh

會在/etc/services與/etc/inetd.conf檔案中添加nrpe相關的配置項

五、修改NRPE主配置檔案

vi /opt/nrpe/etc/nrpe.conf

主要修改兩個地方:

1、allowed_hosts=127.0.0.1,nagios_server_ip

2、command[check_users]=/opt/nrpe/libexec/check_users -w 5 -c 10 (添加監控指令)

六、啟動NRPE

inetd -k && inetd   (作為inetd背景服務啟動)

七、測試NRPE

/usr/local/nagios/libexec/check_nrpe -H xxxxxx

NRPE v2.12

傳回上資訊測試成功,在服務端同樣測試

netstat -na | grep 5666

檢視nrpe服務端口

安裝過程中常見疑難解答:

其實nrpe安裝很簡單,但針對ORACLE資料庫的檢查(check_oracle),有可能會出現一些問題,這裡整理了下:

1、nagios服務端check_nrpe -H nagios_client_IP時提示ssl連接配接錯誤?

可能原因:

a、檢查nagios_client的nrpe.cfg配置檔案,allowed_hosts有沒有正确添加服務端的IP;

b、檢查openssl包有沒有裝上;

c、檢查伺服器之間的防火牆有沒有放通5666端口;

2、在hpux伺服器上測試check_oracle --cache orcl username password總是提示使用者名密碼錯誤,無論用什麼帳戶都報這個錯誤?

a、一定要注意hpux上輸入oracle相關使用者名密碼進分别用單引号引起來,如'username' 'password'

3、在hpux伺服器上測試check_oracle --login  check_oracle --cache  都可以正常傳回資料,但在nagios服務端總是沒

有資料傳回,但nrpe通信又是正常的,users,disk,load等都可以正常傳回資料?

a、遇到這個問題,最好的測試方法是在nrpe.cfg的中相關監控項目後加上 >> /tmp/output  2>&1 将輸出結果輸入一個

檔案,友善檢視;

b、一些庫檔案找不到,如utils,這個檔案在/opt/nrpe/libexec目錄下有,但系統會自動到/目錄下查找,隻要做個軟連接配接就可以了  

ln -s /opt/nrpe/libexec/utils.sh  /utils.sh

c、提示ps,grep,awk等命名找不到,這當然是環境變量中沒有添加相應命名的路徑,把/usr/bin這個目錄加到PATH

d、提示su:sorry,主要是執行sqlplus操作需要具有oracle使用者的相關權限,隻需要将nrpe使用者添加  到oinstall組

usermod -G oinstall nrpe

4、執行check_oracle這個腳本就報錯,如找不到服務名,沒有權限等等

a、由于我們是在nrpe這個使用者下執行check_oracle,是以一定要注意環境變量問題,把$ORACLE_HOME加到這個腳本中去