HPUX上安裝NRPE,特别是在監控ORACLE資料庫有一些疑難的點,自己一邊摸索一邊整理了出來,就當是做個備忘
一、下載下傳預編譯好的depot源碼包
網址:http://www.mayoxide.com/naghpux
包名:NRPE-2.12.depot.gz
可能還需要另外兩個包的支援,如果作業系統沒有安裝,也請下載下傳:
openssl-1.0.1f-ia64-11.31.depot.gz
tcp_wrappers-7.6-ia64-11.31.depot.gz
二、建立NRPE使用者
groupadd -g 312 nrpe
useradd -g nrpe -G oinstall -u 312 nrpe (注:之是以添加到oinstall組,是使其具備執行oracle插件的權限)
三、HPUX上安裝NRPE
swinstall -s /tmp/NRPE-2.12.depot.gz
swlist -l product | grep NRPE
四、将NRPE配置為inetd管理程序
/opt/nrpe/bin/configure.sh
會在/etc/services與/etc/inetd.conf檔案中添加nrpe相關的配置項
五、修改NRPE主配置檔案
vi /opt/nrpe/etc/nrpe.conf
主要修改兩個地方:
1、allowed_hosts=127.0.0.1,nagios_server_ip
2、command[check_users]=/opt/nrpe/libexec/check_users -w 5 -c 10 (添加監控指令)
六、啟動NRPE
inetd -k && inetd (作為inetd背景服務啟動)
七、測試NRPE
/usr/local/nagios/libexec/check_nrpe -H xxxxxx
NRPE v2.12
傳回上資訊測試成功,在服務端同樣測試
netstat -na | grep 5666
檢視nrpe服務端口
安裝過程中常見疑難解答:
其實nrpe安裝很簡單,但針對ORACLE資料庫的檢查(check_oracle),有可能會出現一些問題,這裡整理了下:
1、nagios服務端check_nrpe -H nagios_client_IP時提示ssl連接配接錯誤?
可能原因:
a、檢查nagios_client的nrpe.cfg配置檔案,allowed_hosts有沒有正确添加服務端的IP;
b、檢查openssl包有沒有裝上;
c、檢查伺服器之間的防火牆有沒有放通5666端口;
2、在hpux伺服器上測試check_oracle --cache orcl username password總是提示使用者名密碼錯誤,無論用什麼帳戶都報這個錯誤?
a、一定要注意hpux上輸入oracle相關使用者名密碼進分别用單引号引起來,如'username' 'password'
3、在hpux伺服器上測試check_oracle --login check_oracle --cache 都可以正常傳回資料,但在nagios服務端總是沒
有資料傳回,但nrpe通信又是正常的,users,disk,load等都可以正常傳回資料?
a、遇到這個問題,最好的測試方法是在nrpe.cfg的中相關監控項目後加上 >> /tmp/output 2>&1 将輸出結果輸入一個
檔案,友善檢視;
b、一些庫檔案找不到,如utils,這個檔案在/opt/nrpe/libexec目錄下有,但系統會自動到/目錄下查找,隻要做個軟連接配接就可以了
ln -s /opt/nrpe/libexec/utils.sh /utils.sh
c、提示ps,grep,awk等命名找不到,這當然是環境變量中沒有添加相應命名的路徑,把/usr/bin這個目錄加到PATH
d、提示su:sorry,主要是執行sqlplus操作需要具有oracle使用者的相關權限,隻需要将nrpe使用者添加 到oinstall組
usermod -G oinstall nrpe
4、執行check_oracle這個腳本就報錯,如找不到服務名,沒有權限等等
a、由于我們是在nrpe這個使用者下執行check_oracle,是以一定要注意環境變量問題,把$ORACLE_HOME加到這個腳本中去