天天看點

Zabbix企業應用之伺服器硬體資訊監控

之前介紹的Zabbix監控都是屬于監控服務方面,現在介紹一下Zabbix監控伺服器硬體資訊的。

由于我公司伺服器都是使用Dell(我公司是手遊方面,伺服器全部是Dell),伺服器型号有r410、r420、r710、r720,系統有Centos 5.x、Centos 6.x 、Redhat 5.x、Redhat 6.x、Ubuntu 12.04、Ubuntu 12.04.4等版本,對于硬體監控,我測試過Ipmi、Megacli、Smart等,但這些監控軟體的監控内容都比較少,沒有通用的那種,最後找到了Dell專門的Omsa,滿足了我的需求,下面就介紹一下使用Omsa來監控Dell伺服器的硬體資訊。

目前我監控以下的硬體資訊:

1、cpu處理器狀态

2、cpu省電模式狀态(如果開啟了省電模式,在壓力大的時候,會很卡的)

3、raid狀态(比如做了哪個raid模式,raid狀态是否正常)

4、記憶體狀态(可以檢視目前伺服器最大支援多少記憶體,目前多少記憶體,如果記憶體有問題,可以顯示哪個位置記憶體故障)

5、機器溫度狀态(監控機器的溫度是否超過閥值)

6、實體硬碟狀态(監控實體硬碟是否有故障)

7、電源狀态(是單電還是雙電,是否有故障)

8、系統面闆CMOS電池(cmos電池是否有故障)

9、網卡狀态(目前的網卡數量,以及網卡是否有問題)

10、風扇(目前的風扇數量,以及是否有故障)

預設是cpu省電模式監控關閉報警,其他的監控都是15分鐘監控一次,如果連續2次都有問題則報警通知。

下面是監控圖

1、硬體正常的伺服器監控截圖

<a href="http://s3.51cto.com/wyfs02/M00/25/48/wKioL1NdxYuAFlirAAQxcbtC95U846.jpg" target="_blank"></a>

2、部分硬體不正常的監控圖

<a href="http://s3.51cto.com/wyfs02/M00/25/48/wKiom1NdxmOSUNQSAARq-q-aIyU215.jpg" target="_blank"></a>

可以看到此伺服器的cpu開啟了省電模式,并且記憶體條有問題

經過指令行檢視,發現有問題的記憶體條是第一個插槽

<a href="http://s3.51cto.com/wyfs02/M01/25/49/wKioL1NdxmbyfKYWAADg1vjYLso218.jpg" target="_blank"></a>

下面是安裝方法:

一、用戶端

A.在redhat或者centos系統裡安裝

1、安裝dell的yum源

2、安裝omsa

3、做軟連接配接

4、關閉web模式(僅允許運作cli)

5、啟動omsa

6、把omsa加入到開機啟動裡

以上是在centos或者redhat系統裡安裝omsa。

B.下面是在ubuntu下的安裝

1、增加源

2、檢測與增加key

3、更新源

4、安裝omsa

5、做軟連接配接

6、啟動cli模式omsa

C.zabbix用戶端的配置

1、下面是在zabbix_agentd.conf裡配置

2、重新開機zabbix_agentd服務

二、服務端

1、模闆導入

把Template Hardware Monitor導入到zabbix裡(模闆在附件),具體操作不介紹。

2、主機關聯模闆

把需要監控的硬體伺服器關聯此模闆即可

     本文轉自yzy121403725 51CTO部落格,原文連結:http://blog.51cto.com/lookingdream/1857357,如需轉載請自行聯系原作者

繼續閱讀