昨天分享了下伺服器硬體監控的知識,在文章的結尾提到了check_openmanage工具。本文就主要介紹這個工具在伺服器硬體監控方面的作用。
一、check_openmanage介紹
check_openmanage 是一個 Nagios 的插件,它基于 OMSA 擷取相關的報道資訊,用來檢測安裝有 OpenManage Server Administrator (OMSA) 的戴爾伺服器的運作狀态,包括存儲系統、電源、溫度等資訊。
體系結構:
<a href="http://s3.51cto.com/wyfs02/M02/6E/DB/wKioL1WKSsWyBaS3AAFwHXh7vbA126.jpg" target="_blank"></a>
如上圖,nagios提供了兩種方式進行監控資訊的擷取。
1、nagios 伺服器端 check_nrpe 調用被監控端的 check_openmanage 來實作,這種方式要在被監控端安裝 OMSA 和 check_openmanage
2、nagios 伺服器端直接通過 check_openmanage 來遠端監控。這種方式要在 nagios 伺服器端安裝 perl-Net-SNMP,在被監控端安裝SNMP和OMSA。
注意:
由于第一種方式,check_nrpe會消耗伺服器性能,是以建議使用第二種方式。另外,第二種方式也适合使用zabbix的運維監控環境。
二、check_openmanage安裝
check_openmanage的安裝非常簡單,隻需要把它的包拿下來解壓即可。由于包的來源有git倉庫和gz包,是以這裡列舉兩種安裝方式。
方式一:
1
2
3
4
<code>[root@kvm-phy04-jz ~]</code><code># cd /usr/local/src</code>
<code>[root@kvm-phy04-jz src]</code><code># git clone git://git.uio.no/check_openmanage</code>
<code>[root@kvm-phy04-jz src]</code><code># cd check_openmanage</code>
<code>[root@kvm-phy04-jz check_openmanage]</code><code># ./check_openmanage # 不帶任何參數預設輸出伺服器的warning和critical的報警資訊</code>
方式二:
5
<code>[root@kvm-phy04-jz src]</code><code># wget http://folk.uio.no/trondham/software/files/check_openmanage-3.7.11.tar.gz</code>
<code>[root@kvm-phy04-jz src]</code><code># tar zxf check_openmanage-3.7.11.tar.gz</code>
<code>[root@kvm-phy04-jz src]</code><code># cd check_openmanage-3.7.11</code>
<code>[root@kvm-phy04-jz check_openmanage-3.7.11]</code><code># ./check_openmanage</code>
如果提示"Storage Error",則需要加上--no-storage參數
<code>[root@kvm-phy04-jz check_openmanage-3.7.11]</code><code># ./check_openmanage --no-storage</code>
三、check_openmanage使用詳解
check_openmanage提供了很多選項和參數供我們使用,由于官方提供的幫助文檔都是英文的,這裡我就根據使用的經驗進行了翻譯和注解,幫助大家快速的上手這個工具。
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
<code>【通用選項】</code>
<code>-f,--config </code><code># 指定配置檔案</code>
<code>-p,--perfdata </code><code># 輸出性能資料,常和--only連用,不要和-d連用</code>
<code>-t,--timeout 時間值 </code><code># 設定check_openmanage的執行逾時時間</code>
<code>-c,--critical </code><code># 自定義溫度的critical門檻值</code>
<code>-w,--warning </code><code># 自定義溫度的warning門檻值</code>
<code>-F,--fahrenheit </code><code># 使用華氏溫度作為溫度機關</code>
<code>-d,--debug </code><code># 顯示所有檢查項目</code>
<code>-h,--help </code><code># 擷取check_openmanage幫助資訊</code>
<code>-V,--version </code><code># 擷取check_openmanage的版本資訊</code>
<code>【SNMP選項】</code>
<code>-H,--</code><code>hostname</code> <code># 使用snmp協定,擷取指定主機名或ip的伺服器硬體資訊</code>
<code>-C,--community </code><code># 自定義snmp的團體名,預設為public</code>
<code>-P,--protocol </code><code># 自定義snmp的協定版本,預設為2c</code>
<code>--port </code><code># 自定義snmp的端口号,預設為161</code>
<code>-6,--ipv6 </code><code># 使用ipv6替代ipv4,預設為no</code>
<code>--tcp </code><code># 使用TCP協定替代UDP協定,預設為no</code>
<code>【輸出選項】</code>
<code>-i,--info </code><code># 輸出的警告資訊加上伺服器的SN号作為字首</code>
<code>-e,--extinfo </code><code># 輸出系統資訊</code>
<code>-s,--state </code><code># 輸出的資訊之前自帶警告級别,如warning或critical</code>
<code>-S,--short-state </code><code># 輸出的資訊之前自帶警告級别縮寫,如W或C</code>
<code>-o,--okinfo </code><code># 輸出資訊為一行(預設)</code>
<code>-B,--show-blacklist </code><code># 輸出黑名單清單資訊,如果加入黑名單的資訊多了,可以通過-B檢視黑名單的清單資訊</code>
<code>-I,--htmlinfo </code><code># 輸出帶可點選連結的html格式資訊</code>
<code>【檢查控制和黑名單】</code>
<code>-a,--all </code><code># 擷取日志統計和詳細日志輸出</code>
<code>-b,--blacklist component=ID号 </code><code># 黑名單,指定某個元件的指定ID資訊不顯示。ID資訊通過./check_openmanage -d可以看到。和-d搭配使用無效</code>
<code>--only </code><code># 僅輸入某項監控資料</code>
<code>--check component=[0|1],esmlog=[0|1] </code><code># 檢查單個項目或組合項目,0為不檢查,1為檢查,單獨使用</code>
<code>--no-storage </code><code># 不檢查存儲資訊</code>
<code>--vdisk-critical </code><code># 将虛拟磁盤的任何警告都提升為崩潰級别critical</code>
<code>【自定義輸出資訊】</code>
<code>--postmsg </code><code>'自定義資訊'</code> <code># 在輸出的結尾輸出該自定義資訊</code>
<code>在自定義資訊中,我們可以使用如下變量</code>
<code> </code><code>%m </code><code># 系統型号</code>
<code> </code><code>%s </code><code># 系統SN号</code>
<code> </code><code>%b </code><code># BIOS版本</code>
<code> </code><code>%d </code><code># BIOS發型時間</code>
<code> </code><code>%o </code><code># 作業系統名稱</code>
<code> </code><code>%r </code><code># 作業系統核心版本</code>
<code> </code><code>%p </code><code># 實體磁盤數量</code>
<code> </code><code>%l </code><code># 邏輯磁盤數量</code>
<code> </code><code>%n </code><code># 表示換行符</code>
<code> </code><code>%% </code><code># 表示%百分号</code>
參考資料:
2、check_openmanage -h
四、實用範例
由于check_openmanage指令有很多選項,是以在實際使用當中可能會讓使用者很迷惑如何使用,是以這裡列舉一些常用的檢視需求和對應的指令組合。上面介紹了,check_openmanage有兩種擷取資訊的方式,我這裡的範例,主要是上面介紹的第一種方式的前一部分,即使用本地check_openmanage指令檢視。
1、如果執行的時候不帶任何無參數 不帶任何參數預設輸出伺服器的warning和critical的報警資訊
<code>Controller 0 [PERC H310 Mini]: Firmware </code><code>'20.12.1-0002'</code> <code>is out of </code><code>date</code>
<code>Physical Disk 0:1:0 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>Physical Disk 0:1:1 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>Physical Disk 0:1:2 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>Physical Disk 0:1:3 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>Physical Disk 0:1:4 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>Physical Disk 0:1:5 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
2、輸出帶有狀态提示的資訊
<code>[root@kvm-phy04-jz check_openmanage-3.7.11]</code><code># ./check_openmanage -s </code>
<code>WARNING: Controller 0 [PERC H310 Mini]: Firmware </code><code>'20.12.1-0002'</code> <code>is out of </code><code>date</code>
<code>WARNING: Physical Disk 0:1:0 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>WARNING: Physical Disk 0:1:1 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>WARNING: Physical Disk 0:1:2 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>WARNING: Physical Disk 0:1:3 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>WARNING: Physical Disk 0:1:4 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>WARNING: Physical Disk 0:1:5 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
3、使用黑名單,不檢查Firmware固件版本更新提示
<code>[root@kvm-phy04-jz check_openmanage-3.7.11]</code><code># ./check_openmanage -s -b ctrl_fw=0</code>
4、使用黑名單,不檢查磁盤未認證的提示
WARNING: Controller 0 [PERC H310 Mini]: Firmware '20.12.1-0002' is out of date
5、使用黑名單,不檢查ID為0的Firmware固件版本更新提示和ID為0:0:1:0的實體磁盤的未認證提示
<code>[root@kvm-phy04-jz check_openmanage-3.7.11]</code><code># ./check_openmanage -b ctrl_fw=0\/pdisk=0:0:1:0</code>
6、使用黑名單,不檢查ID為0的Firmware固件版本更新提示和未認證的實體磁盤提示
<code>[root@kvm-phy04-jz check_openmanage-3.7.11]</code><code># ./check_openmanage -b ctrl_fw=0\/pdisk=ALL</code>
<code>OK - System: </code><code>'PowerEdge R720'</code><code>, SN: </code><code>'33R0G42'</code><code>, 32 GB </code><code>ram</code> <code>(4 dimms), 1 logical drives, 6 physical drives</code>
7、輸出所有檢查項目
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
<code>[root@kvm-phy04-jz check_openmanage-3.7.11]</code><code># ./check_openmanage -d</code>
<code> </code><code>System: PowerEdge R720 OMSA version: 8.1.0</code>
<code> </code><code>ServiceTag: 33R0G42 Plugin version: 3.7.11</code>
<code> </code><code>BIOS</code><code>/date</code><code>: 2.4.3 07</code><code>/09/2014</code> <code>Checking mode: </code><code>local</code>
<code>-----------------------------------------------------------------------------</code>
<code> </code><code>Storage Components </code>
<code>=============================================================================</code>
<code> </code><code>STATE | ID | MESSAGE TEXT </code>
<code>---------+----------+--------------------------------------------------------</code>
<code> </code><code>WARNING | 0 | Controller 0 [PERC H310 Mini]: Firmware </code><code>'20.12.1-0002'</code> <code>is out of </code><code>date</code>
<code> </code><code>OK | 0 | Controller 0 [PERC H310 Mini] is Degraded</code>
<code> </code><code>WARNING | 0:0:1:0 | Physical Disk 0:1:0 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code> </code><code>WARNING | 0:0:1:1 | Physical Disk 0:1:1 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code> </code><code>WARNING | 0:0:1:2 | Physical Disk 0:1:2 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code> </code><code>WARNING | 0:0:1:3 | Physical Disk 0:1:3 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code> </code><code>WARNING | 0:0:1:4 | Physical Disk 0:1:4 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code> </code><code>WARNING | 0:0:1:5 | Physical Disk 0:1:5 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code> </code><code>OK | 0:0 | Logical Drive </code><code>'/dev/sda'</code> <code>[RAID-10, 836.63 GB] is Ready</code>
<code> </code><code>OK | 0:0 | Connector 0 [SAS Port RAID Mode] on controller 0 is Ready</code>
<code> </code><code>OK | 0:1 | Connector 1 [SAS Port RAID Mode] on controller 0 is Ready</code>
<code> </code><code>OK | 0:0:1 | Enclosure 0:0:1 [Backplane] on controller 0 is Ready</code>
<code> </code><code>Chassis Components </code>
<code> </code><code>STATE | ID | MESSAGE TEXT </code>
<code>---------+------+------------------------------------------------------------</code>
<code> </code><code>OK | 0 | Memory module 0 [DIMM_A1, 8192 MB] is Ok</code>
<code> </code><code>OK | 1 | Memory module 1 [DIMM_A2, 8192 MB] is Ok</code>
<code> </code><code>OK | 2 | Memory module 2 [DIMM_B1, 8192 MB] is Ok</code>
<code> </code><code>OK | 3 | Memory module 3 [DIMM_B2, 8192 MB] is Ok</code>
<code> </code><code>OK | 0 | Chassis fan 0 [System Board Fan1 RPM] reading: 3000 RPM</code>
<code> </code><code>OK | 1 | Chassis fan 1 [System Board Fan2 RPM] reading: 3000 RPM</code>
<code> </code><code>OK | 2 | Chassis fan 2 [System Board Fan3 RPM] reading: 2880 RPM</code>
<code> </code><code>OK | 3 | Chassis fan 3 [System Board Fan4 RPM] reading: 3000 RPM</code>
<code> </code><code>OK | 4 | Chassis fan 4 [System Board Fan5 RPM] reading: 2880 RPM</code>
<code> </code><code>OK | 5 | Chassis fan 5 [System Board Fan6 RPM] reading: 3000 RPM</code>
<code> </code><code>OK | 0 | Power Supply 0 [AC]: Presence Detected</code>
<code> </code><code>OK | 0 | Temperature Probe 0 [System Board Inlet Temp] reads 27 C (min=3</code><code>/-7</code><code>, max=42</code><code>/47</code><code>)</code>
<code> </code><code>OK | 1 | Temperature Probe 1 [System Board Exhaust Temp] reads 31 C (min=8</code><code>/3</code><code>, max=70</code><code>/75</code><code>)</code>
<code> </code><code>OK | 2 | Temperature Probe 2 [CPU1 Temp] reads 36 C (min=8</code><code>/3</code><code>, max=79</code><code>/84</code><code>)</code>
<code> </code><code>OK | 3 | Temperature Probe 3 [CPU2 Temp] reads 31 C (min=8</code><code>/3</code><code>, max=79</code><code>/84</code><code>)</code>
<code> </code><code>OK | 0 | Processor 0 [Intel Xeon E5-2630 v2 2.60GHz] is Present</code>
<code> </code><code>OK | 1 | Processor 1 [Intel Xeon E5-2630 v2 2.60GHz] is Present</code>
<code> </code><code>OK | 0 | Voltage sensor 0 [CPU1 VCORE PG] is Good</code>
<code> </code><code>OK | 1 | Voltage sensor 1 [CPU2 VCORE PG] is Good</code>
<code> </code><code>OK | 2 | Voltage sensor 2 [System Board 3.3V PG] is Good</code>
<code> </code><code>OK | 3 | Voltage sensor 3 [System Board 5V PG] is Good</code>
<code> </code><code>OK | 4 | Voltage sensor 4 [CPU2 PLL PG] is Good</code>
<code> </code><code>OK | 5 | Voltage sensor 5 [CPU1 PLL PG] is Good</code>
<code> </code><code>OK | 6 | Voltage sensor 6 [System Board 1.1V PG] is Good</code>
<code> </code><code>OK | 7 | Voltage sensor 7 [CPU1 M23 VDDQ PG] is Good</code>
<code> </code><code>OK | 8 | Voltage sensor 8 [CPU1 M23 VTT PG] is Good</code>
<code> </code><code>OK | 9 | Voltage sensor 9 [System Board FETDRV PG] is Good</code>
<code> </code><code>OK | 10 | Voltage sensor 10 [CPU2 VSA PG] is Good</code>
<code> </code><code>OK | 11 | Voltage sensor 11 [CPU1 VSA PG] is Good</code>
<code> </code><code>OK | 12 | Voltage sensor 12 [CPU2 M01 VDDQ PG] is Good</code>
<code> </code><code>OK | 13 | Voltage sensor 13 [CPU1 M01 VDDQ PG] is Good</code>
<code> </code><code>OK | 14 | Voltage sensor 14 [CPU2 M23 VTT PG] is Good</code>
<code> </code><code>OK | 15 | Voltage sensor 15 [CPU2 M01 VTT PG] is Good</code>
<code> </code><code>OK | 16 | Voltage sensor 16 [System Board NDC PG] is Good</code>
<code> </code><code>OK | 17 | Voltage sensor 17 [CPU2 VTT PG] is Good</code>
<code> </code><code>OK | 18 | Voltage sensor 18 [CPU1 VTT PG] is Good</code>
<code> </code><code>OK | 19 | Voltage sensor 19 [CPU2 M23 VDDQ PG] is Good</code>
<code> </code><code>OK | 20 | Voltage sensor 20 [System Board 1.5V PG] is Good</code>
<code> </code><code>OK | 21 | Voltage sensor 21 [System Board PS2 PG Fail] is Good</code>
<code> </code><code>OK | 22 | Voltage sensor 22 [System Board PS1 PG Fail] is Good</code>
<code> </code><code>OK | 23 | Voltage sensor 23 [System Board BP1 5V PG] is Good</code>
<code> </code><code>OK | 24 | Voltage sensor 24 [CPU1 M01 VTT PG] is Good</code>
<code> </code><code>OK | 25 | Voltage sensor 25 [PS1 Voltage 1] reads 220 V</code>
<code> </code><code>OK | 0 | Battery probe 0 [System Board CMOS Battery] is Good</code>
<code> </code><code>OK | 1 | Amperage probe 1 [System Board Pwr Consumption] reads 112 W</code>
<code> </code><code>OK | 0 | Chassis intrusion 0 detection: Ok (Chassis is closed)</code>
<code> </code><code>OK | 0 | SD Card 0 [vFlash] is Absent</code>
<code> </code><code>Other messages </code>
<code> </code><code>STATE | MESSAGE TEXT </code>
<code>---------+-------------------------------------------------------------------</code>
<code> </code><code>OK | ESM log health is Ok (</code><code>less</code> <code>than 80% full)</code>
<code> </code><code>OK | Chassis Service Tag is sane</code>
8、将伺服器的SN号作為警告資訊的輸出字首
<code>[root@kvm-phy04-jz check_openmanage-3.7.11]</code><code># ./check_openmanage -i </code>
<code>[33R0G42] Controller 0 [PERC H310 Mini]: Firmware </code><code>'20.12.1-0002'</code> <code>is out of </code><code>date</code>
<code>[33R0G42] Physical Disk 0:1:0 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>[33R0G42] Physical Disk 0:1:1 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>[33R0G42] Physical Disk 0:1:2 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>[33R0G42] Physical Disk 0:1:3 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>[33R0G42] Physical Disk 0:1:4 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
<code>[33R0G42] Physical Disk 0:1:5 [Seagate ST3300657SS, 300GB] on ctrl 0 is Online, Not Certified</code>
9、不檢查存儲
<code>OK - System: </code><code>'PowerEdge R720'</code><code>, SN: </code><code>'33R0G42'</code><code>, 32 GB </code><code>ram</code> <code>(4 dimms), not checking storage</code>
10、使用黑名單,不顯示Firmware固件版本更新和未認證磁盤提示資訊,并輸出系統資訊
<code>[root@kvm-phy04-jz check_openmanage-3.7.11]</code><code># ./check_openmanage -e -b ctrl_fw=0\/pdisk=ALL</code>
<code>------ SYSTEM: PowerEdge R720, SN: 33R0G42</code>
五、使用check_openmanage擷取遠端伺服器資訊
正常情況下,如果使用check_openmanage檢查本機的資訊,可以直接像上面的指令一樣直接使用check_openmanage指令去檢視。他也支援在某一台機器上集中檢視其它實體伺服器的資訊,此時要跟上-H ip_address資訊才行。并且,被監控的伺服器上還需要安裝如下幾個包:
net-snmp
perl-Net-SNMP
srvadmin-all
安裝順序上,net-snmp一定要放在srvadmin-all之前安裝。這樣子,srvadmin-all在安裝的時候,會自動幫助你設定好snmp的資訊。
安裝範例:
被監控伺服器kvm-phy04-jz:
<code>[root@kvm-phy05-jz ~]</code><code># yum install -y net-snmp net-snmp-devel net-snmp-utils</code>
<code>[root@kvm-phy05-jz ~]</code><code># wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash</code>
<code>[root@kvm-phy05-jz ~]</code><code># yum -y install OpenIPMI srvadmin-all</code>
<code>[root@kvm-phy05-jz ~]</code><code># yum remove -y srvadmin-tomcat srvadmin-jre srvadmin-smweb</code>
<code>[root@kvm-phy05-jz ~]</code><code># rm -rf /opt/dell/srvadmin/lib64/openmanage/apache-tomcat</code>
<code>[root@kvm-phy05-jz ~]</code><code># /etc/init.d/snmpd restart</code>
<code>[root@kvm-phy05-jz ~]</code><code># chkconfig snmpd on</code>
<code>[root@kvm-phy05-jz ~]</code><code># /opt/dell/srvadmin/sbin/srvadmin-services.sh restart</code>
<code>[root@kvm-phy05-jz ~]</code><code># /opt/dell/srvadmin/sbin/srvadmin-services.sh enable</code>
監控伺服器kvm-phy04-jz:
<code>[root@kvm-phy04-jz check_openmanage-3.7.11]</code><code># yum install -y perl-Net-SNMP</code>
<code>[root@kvm-phy04-jz check_openmanage-3.7.11]</code><code># ./check_openmanage -H 192.168.0.210</code>
<code>Controller 0 [PERC H310 Mini]: Firmware </code><code>'20.12.0-0004'</code> <code>is out of </code><code>date</code>
<code>Physical Disk 0:1:0 [Unknown vendor INTEL SSDSC2BA200G3, 199GB] on ctrl 0 is Online, Not Certified</code>
<code>Physical Disk 0:1:1 [Unknown vendor INTEL SSDSC2BA200G3, 199GB] on ctrl 0 is Online, Not Certified</code>
<code>Physical Disk 0:1:2 [Unknown vendor INTEL SSDSC2BA200G3, 199GB] on ctrl 0 is Online, Not Certified</code>
<code>Physical Disk 0:1:3 [Unknown vendor INTEL SSDSC2BA200G3, 199GB] on ctrl 0 is Online, Not Certified</code>
<code>Physical Disk 0:1:4 [Unknown vendor INTEL SSDSC2BA200G3, 199GB] on ctrl 0 is Online, Not Certified</code>
<code>Physical Disk 0:1:5 [Unknown vendor INTEL SSDSC2BA200G3, 199GB] on ctrl 0 is Online, Not Certified</code>
總結:
如果運維環境使用的是nagios+cacti的監控架構,使用check_openmanage可以非常友善的對線上伺服器硬體進行監控預警。由于我司的監控架構使用的是zabbix,是以這裡不再多說nagios的具體監控實施操作。感興趣的同學可以參考下面兩篇博文的講解:
報錯集錦:
報錯1:
ERROR: You need perl module Net::SNMP to run check_openmanage in SNMP mode
原因:
SNMP監控模式下,check_openmanage 需要 perl-Net-SNMP 支援
解決方案:
安裝perl-Net-SNMP包
# yum install -y perl-Net-SNMP
報錯2:
ERROR: (SNMP) OpenManage is not installed or is not working correctly
snmp未配置導緻。如果先安裝snmp,在安裝omsa的時候會自動幫你配置好snmp
配置資訊如下:
<a href="http://s3.51cto.com/wyfs02/M00/6E/DE/wKiom1WKQhTj8DqNAAhMegyk8vU468.jpg" target="_blank"></a>
1、先安裝net-snmp,再安裝omsa(即srvadmin-all)
or
2、手動按照上圖資訊進行配置
報錯3:
SNMP CRITICAL: No response from remote host 'X.X.X.X'
被監控端沒有安裝snmp服務
安裝snmp服務
# yum install -y net-snmpd
OK,本文到此,希望能對51博友有所幫助!
本文轉自 aaao 51CTO部落格,原文連結:http://blog.51cto.com/nolinux/1665075,如需轉載請自行聯系原作者