遇到一個坑爹的問題,必須記錄下來。
問題描述:監控的主機分為了多個組,使用者專門建了一個用于接收報警的組,然而這個組成員隻能接收某個主機的報警,而不能接收其他主機的報警(現在回想起來了,最後那幾個組是新建立的)。
排查的過程:
先讓其觸發一個告警,然後觸發器沒有執行動作,檢查了報警媒介、觸發器、動作,都沒問題。奇怪……
手動發送郵件測試也沒問題,隻能放大招了,重新開機zabbix_server,結果還是不行……
隻能放終極大招了,重新開機linux系統。還是不行……
他大爺的,最後看了一下使用者組,原來建立的監控主機組不在使用者組中,并沒有權限。
oh fuck!what's happened?
可以了!
另一種可能:
通過檢視agent日志,4200:20170928:173000.693 no active checks on server [47.93.x.x:10051]: host [iZrwn7pkbbterpZ] not found
解決:這種問題一般是zabbix web 主機配置中的名字和agent端的agent.conf中的hostname名字不一緻導緻的。對比着zabbix web中的主機名字修改agent.conf即可解決。
注意:這裡涉及到監控的主動模式和被動模式,如果是用被動模式,那麼主機名必須和zabbix web一緻,否則就用主動模式,在zabbix—gent注釋掉:ServerActive=x.x.x.x:10051和#Hostname=Windows
另一種可能:存在曆史記錄,需要清除曆史記錄,重新添加模闆,尤其是觸發器使用了模闆
本文轉自 王家東哥 51CTO部落格,原文連結:http://blog.51cto.com/xiaodongge/1968911