關于Zabbix監控伺服器硬的件資訊,Zabbix官方網站沒有提到這方面的監控思路和方法。之前我寫的博文中寫過關于HP伺服器硬體監控的文 章,大緻的思路是借助HP管理工具通過腳本的方式取出硬體的資訊,然後以trapper的方式通過進行監控,得到好多博友的支援,在此特别感謝。
通過腳本的方式監控伺服器硬體資訊,有以下三個缺點:
1) 通過agent的方式監控會逾時,取不到值。
2)通過trapper的方式需要每台機器添加crontab,部署起來麻煩。
3)腳本通用性差,隻适合Windows機器。
4)G8的伺服器執行管理指令非常慢。
由于通過腳本監控硬體有以上幾個缺點,是以後來研究了HP代理。通過HP代理和SNMP監控HP伺服器的硬體,需要安裝snmp服務和HP代理工具。
然後通過snmpwalk指令測試是否可以擷取資料,下面擷取的是HP伺服器各部件的實際溫度值。
<a href="http://s3.51cto.com/wyfs02/M01/57/77/wKioL1SbZLrwdTWjAAY80UDQQ0c404.jpg" target="_blank"></a>
建立監控模闆,通過Zabbix Low-level discovery 可以自動建立監控項,觸發器和圖像。Zabbix官方文檔中LLD支援以下三種監控自動發現:
1)檔案系統自動發現
2)伺服器網卡的自動發現
3)SNMP OID的自動發現
下面通過第三種方法來監控HP伺服器硬體資訊,以SNMP監控HP伺服器陣列卡為例子來說明一下實作原理。
1)首先建立監控模闆和Applications。
<a href="http://s3.51cto.com/wyfs02/M00/57/73/wKioL1Saerjz9jqtAAGkFPqDrnw672.jpg" target="_blank"></a>
2)點選模闆的discovery->Create discovery rule。
<a href="http://s3.51cto.com/wyfs02/M01/57/74/wKiom1SaaUXgB-5EAAKQxrZ5JrE446.jpg" target="_blank"></a>
3)建立監控項目Create item prototype。HP代理中的MIB資訊沒有被解析成具體的裝置名稱,是以Name中的#SNMPVALUE就是為了區分多個裝置名稱,如 HardDisk_0_status,HardDisk_1_status表示第一個硬碟和第二個硬碟的狀态。
<a href="http://s3.51cto.com/wyfs02/M02/57/74/wKiom1SaaqTQmTuOAANbzs8tN5w478.jpg" target="_blank"></a>
4)建立觸發器Create trigger prototype。HP伺服器硬碟,陣列卡,邏輯磁盤等的狀态正常傳回值都是2,如果不是2,說明有問題,觸發報警。
<a href="http://s3.51cto.com/wyfs02/M00/57/74/wKiom1Saa-LCcwZKAAGzdWK8zRQ640.jpg" target="_blank"></a>
5)用同樣的方法可以監控HP硬碟的狀态,邏輯磁盤的狀态,風扇的狀态,HP各部件的溫度等。
<a href="http://s3.51cto.com/wyfs02/M02/57/75/wKiom1SaeCXCXaUZAARbgbCNcCc979.jpg" target="_blank"></a>
6)下面通過DDL自動發現伺服器的實體硬碟的監控項和觸發器,有多少個硬碟就會有多少個監控項和觸發器。
<a href="http://s3.51cto.com/wyfs02/M02/57/73/wKioL1SagKXzRnLZAACxAX4vCeY719.jpg" target="_blank"></a>
7)Link模闆到監控主機上面,當主機整列卡有問題的時候會報警。
<a href="http://s3.51cto.com/wyfs02/M02/57/74/wKiom1SacXLg7TDfAACSED81e1c403.jpg" target="_blank"></a>
本文轉自 15816815732 51CTO部落格,原文連結:http://blog.51cto.com/68686789/1705043