天天看點

告警系統郵件引擎, 運作告警系統告警系統郵件引擎運作告警系統

告警系統郵件引擎

  • 因為之前做zabbix的時候,做過mail.py的腳本,在這裡,直接複制到

    mail目錄下就行

  • 但是告警郵件引擎核心,conf主配置檔案調用到的都是mail.sh ,是以這裡需要定義調用mail.py的sh腳本
  • mail.sh目的是做告警收斂,如果不想做告警收斂,在發現問題的時候直接告警就好,但是,可能會發生1分鐘前發現問題,1分鐘戶問題解決,這樣就會變成誤報,這樣會很麻煩
  • 收斂的目的就是1分鐘前發現問題,然後到10分鐘後,服務還沒有恢複,就會告訴管理人員10分鐘了服務還未恢複
    #!/bin/bahs
    log=$1   
    t_s=`date +%s`
    t_s2=`date -d "2 hours ago" +%s`  #定義2個小時前的時間戳
    #日志不存在就建立日志
    if [ ! -f /tmp/$log ]
    then
    echo $t_s2 > /tmp/$log
    fi
    #下面這段,等同于一個計時器
    t_s2=`tail -1 /tmp/$log|awk '{print $1}'`
    echo $t_s>>/tmp/$log
    v=$[$t_s-$t_s2]   //時間戳對比
    echo $v
    #當結果大于3600秒,就會進行告警
    if [ $v -gt 3600 ]
    then
    ./mail.py  $1  $2  $3
    echo "0" > /tmp/$log.txt  //等同于計數器
    else
    #不然就重新計數
    if [ ! -f /tmp/$log.txt ]
    then
        echo "0" > /tmp/$log.txt
    fi
    nu=`cat /tmp/$log.txt`
    nu2=$[$nu+1]
    echo $nu2>/tmp/$log.txt
    if [ $nu2 -gt 10 ]
    then
         ./mail.py  $1 "trouble continue 10 min $2" "$3"
         echo "0" > /tmp/$log.txt   //郵件告警結束以後,重新開始計數
    fi
    fi            

    運作告警系統

  • 可以每分鐘執行一次主腳本來運作告警系統
    crontab -e
    * * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh           
  • 調試,監控發送郵件的部分,有三個參數(發給誰,郵件名稱,内容),參數之間盡量少用空格,因為mail.py發送郵件是以空格來定義三個參數的

繼續閱讀