之前介紹的Zabbix監控都是屬于監控服務方面,現在介紹一下Zabbix監控伺服器硬體資訊的。
由于我公司伺服器都是使用Dell(我公司是手遊方面,伺服器全部是Dell),伺服器型号有r410、r420、r710、r720,系統有Centos 5.x、Centos 6.x 、Redhat 5.x、Redhat 6.x、Ubuntu 12.04、Ubuntu 12.04.4等版本,對于硬體監控,我測試過Ipmi、Megacli、Smart等,但這些監控軟體的監控内容都比較少,沒有通用的那種,最後找到了Dell專門的Omsa,滿足了我的需求,下面就介紹一下使用Omsa來監控Dell伺服器的硬體資訊。
目前我監控以下的硬體資訊:
1、cpu處理器狀态
2、cpu省電模式狀态(如果開啟了省電模式,在壓力大的時候,會很卡的)
3、raid狀态(比如做了哪個raid模式,raid狀态是否正常)
4、記憶體狀态(可以檢視目前伺服器最大支援多少記憶體,目前多少記憶體,如果記憶體有問題,可以顯示哪個位置記憶體故障)
5、機器溫度狀态(監控機器的溫度是否超過閥值)
6、實體硬碟狀态(監控實體硬碟是否有故障)
7、電源狀态(是單電還是雙電,是否有故障)
8、系統面闆CMOS電池(cmos電池是否有故障)
9、網卡狀态(目前的網卡數量,以及網卡是否有問題)
10、風扇(目前的風扇數量,以及是否有故障)
預設是cpu省電模式監控關閉報警,其他的監控都是15分鐘監控一次,如果連續2次都有問題則報警通知。
下面是監控圖
1、硬體正常的伺服器監控截圖
<a href="http://s3.51cto.com/wyfs02/M00/25/48/wKioL1NdxYuAFlirAAQxcbtC95U846.jpg" target="_blank"></a>
2、部分硬體不正常的監控圖
<a href="http://s3.51cto.com/wyfs02/M00/25/48/wKiom1NdxmOSUNQSAARq-q-aIyU215.jpg" target="_blank"></a>
可以看到此伺服器的cpu開啟了省電模式,并且記憶體條有問題
經過指令行檢視,發現有問題的記憶體條是第一個插槽
<a href="http://s3.51cto.com/wyfs02/M01/25/49/wKioL1NdxmbyfKYWAADg1vjYLso218.jpg" target="_blank"></a>
下面是安裝方法:
一、用戶端
A.在redhat或者centos系統裡安裝
1、安裝dell的yum源
2、安裝omsa
3、做軟連接配接
4、關閉web模式(僅允許運作cli)
5、啟動omsa
6、把omsa加入到開機啟動裡
以上是在centos或者redhat系統裡安裝omsa。
B.下面是在ubuntu下的安裝
1、增加源
2、檢測與增加key
3、更新源
4、安裝omsa
5、做軟連接配接
6、啟動cli模式omsa
C.zabbix用戶端的配置
1、下面是在zabbix_agentd.conf裡配置
2、重新開機zabbix_agentd服務
二、服務端
1、模闆導入
把Template Hardware Monitor導入到zabbix裡(模闆在附件),具體操作不介紹。
2、主機關聯模闆
把需要監控的硬體伺服器關聯此模闆即可
本文轉自yzy121403725 51CTO部落格,原文連結:http://blog.51cto.com/lookingdream/1857357,如需轉載請自行聯系原作者