近期SLS釋出了新版告警,新版本告警在更新原有功能的基礎上,擴充了告警監控、告警管理、通知(行動)管理的能力,SLS新版告警還支援在控制台将舊版告警一鍵更新為新版告警。本文首先會介紹新版與舊版在架構、功能和配置上的差別,然後通過一個執行個體示範如果将舊版告警一鍵更新為新版告警。
架構對比
新版告警在告警規則任務監控資料、觸發通知後,通過告警政策進行降噪、通過行動政策進行管道分派管理。并支援額外的告警狀态管理和告警更新。
舊版告警工作流程

新版告警工作流程

功能對比
新版本對原有舊版本的功能進行了更新,并且新增了很多實用的功能,這裡不再詳細展開介紹,更詳細的功能對比可以
參考;
功能更新
- 監控目标:除了支援原來的日志,時序和外部資料源(OSS,MySQL)等,還支援使用者直接在SLS建立自定義資源表;
- 觸發條件:舊版告警僅支援對查詢的集合操作結果任意條資料判斷(任一條資料滿足即為觸發);新版告警支援四種觸發條件的判斷,既支援對結果中資料進行評估,還支援對結果條數進行評估,及其之間的組合評估;
- 報表關聯:舊版告警強制告警必須與儀表盤關聯,新版告警取消了報表的強制關聯;
- 多庫聯合查詢:舊版告警支援對三張表進行笛卡爾積結果評估,新版告警增加了不合并、拼接、左聯、右聯、全聯合、左斥和右斥等集合操作功能;
功能新增
- 告警監控:增加了資料協同關聯監控能力,黑白名單監控,告警嚴重度,标簽,标注,多目标監控,無資料告警和告警恢複,詳細可以
- 告警管理:增加了 告警降噪控制 和 告警事件管理
- 通知管理:支援告警動态分派和級别提升,接收人管理,管道月曆,值班表管理,管道額度控制,詳細可以
- 告警分析:增加了監控規則中心,告警鍊路中心,告警排障中心。
舊版告警更新流程
舊版告警更新涉及到的配置項的一些變化,主要包含配置項包括監控配置,通知配置,内容模闆變量修改。
監控配置
對于新增的監控配置項在更新過程中設定了預設值

通知配置
更新後,日志服務提取手機号、郵箱作為使用者辨別,并建立對應的使用者;提取通知内容作為内容模闆的内容;根據通知管道配置生成對應的行動政策;預設使用SLS内置動态告警政策。

模闆變量
新版告警對模闆變量進行了優化,并增加了多個更新的變量,
舊版告警更新執行個體
接下來以一個舊版告警為例,在SLS控制台一鍵更新為新版告警。
基于Nginx通路日志,我們建立一個監控500錯誤過多的舊版告警,主要監控邏輯是查詢過去15分鐘内出現500的請求次數是否大于10個,如果大于10個,就發出告警,通知到釘釘機器人和郵件,通知間隔預設設定為5分鐘(表示同一條告警每次評估,5分鐘内隻會收到一次通知)
配置舊版告警
- 監控配置如下:

- 通知配置如下,包括釘釘和郵件通知管道:

更新
- 點選更新按鈕,更新為新版告警
-
- 如果是首次使用新版告警,請根據頁面提示配置存儲中心,并單擊确認。配置完成後,日志服務将自動在您所選的地域建立一個名為sls-alert-主賬号ID-區域的Project和名為internal-alert-center-log的Logstore,用于存儲告警相關資訊。
- 點選确認後會彈出更新告警涉及到一些配置項,如下;
-
- 本次更新會增加一個行動政策,内容包含告警觸發後的通知管道設定,包含釘釘和郵件通知;
- 增加一個内容模闆,指定在要釘釘和郵件中發送的内容,其中已經自動将舊版告警的内容模闆變量更新為新的内容模闆變量;
- 增加一個使用者,取舊版告警中的短信,語音以及釘釘通知中@人的手機号作為手機使用者,取郵件管道中的郵件位址作為郵件使用者,本次更新因為隻配置了郵件和釘釘(未指定@手機号),是以會提取郵件位址建立使用者。
- 點選确認,新版告警更新成功,重新查詢該告警,點選修改配置,可以看到已經更新為新版告警編輯頁面
檢視更新結果
- 告警規則
-
- 規則名,檢查頻率,查詢統計等基礎資訊保持不變
- 分組評估,預設設定為不分組
- 觸發條件,更新為有資料比對+評估表達式,與原有邏輯保持相容
- 告警嚴重度,預設設定為中
- 标注,預設增加标題和描述,取值為告警名稱
- 告警政策和行動政策,告警政策預設使用内置動态告警;行動政策,會生成了一個新的名稱為“行動政策遷移自_Nginx500錯誤過多”的行動政策;重複等待取自原來的通知間隔時間,邏輯保持相容

- 行動政策
點選上圖中行動政策的查詢配置詳情,彈出遷移好的行動政策編輯頁面,其中原來的通知管道配置,在該行動政策中被包含在行動組中,這裡包含釘釘和郵件兩個行動。


- 内容模闆
-
- 點選上圖中的釘釘的配置,點選内容模闆的檢視,可以看到一個名稱為“内容模闆遷移自_Nginx500錯誤過多”的内容模闆
- 内容模闆包括每個通知管道的發送内容,這裡涉及到釘釘和郵件的内容
- 點開釘釘(Webhook)頁籤,可以看到發送内容已經遷移好,并且使用了新的模闆變量,也可以點選郵件頁籤,查詢郵件内容

- 通知結果對比,以下為釘釘發送通知的對比


這樣一個舊版告警更新就完成了,更新過程比較簡單,基本實作了“一鍵更新”,在更新後使用者可以通過修改配置使用到新版功能中的新功能,例如可以設定無資料告警和告警恢複通知,還可以對告警進行降噪和事件管理。
- 什麼是日志服務告警【 連結 】
- SLS告警舊版與新版差別,及遷移到新版【
- SLS新版告警通知管理【
進一步參考
- SLS(日志服務)雲原生觀測分析平台: https://www.aliyun.com/product/sls
- SLS新版告警文檔首頁: https://help.aliyun.com/document_detail/207609.html
- 歡迎掃群加入阿裡雲-日志服務(SLS)技術交流
- 後續系列直播與教育訓練視訊會同步到B站,敬請留意

最後,如果您還想了解更多智能運維前沿資訊,歡迎您報名參加【數智創新行·智能運維專場】。
6月25日|上海·西岸國際人工智能中心
數智創新行上海站·智能運維專場
阿裡雲将帶來雲原生智能運維解決方案,滿足海量事件有效感覺、高效響應,可觀測資料統一分析、故障定位,以及基于AI的異常檢測等需求,助力企業建構自己的運維平台,成為開發、運維人員高效可靠的助手。
掃描海報二維碼或點選下方連結報名, 期待您一起開啟智能運維新時代!
https://www.aliyun.com/page-source//developer/special/osssalon