天天看點

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

前言

本篇是SLS新版告警系列宣傳與教育訓練的第二篇,後續我們會推出20+系列直播與實戰教育訓練視訊,敬請關注。

系列目錄(持續更新)

1. 新版SLS告警介紹

1.1. 正常告警運維系統的痛點

可觀測性對于告警監控運維系統是有很高的要求的,但現狀卻不容樂觀,我們可以看到正常監控運維系統存在如下6大痛點:

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

具體展開細化如下:

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

1.2. 新版SLS新版告警釋出

SLS新版告警

在中國站等釋出公測(國際站預計4月釋出),新版在SLS雲原生可觀測性平台上提供了一站式智能運維告警系統。新版告警提供對日志、時序等各類資料的告警監控,亦可接受三方告警,對告警進行降噪、事件管理、通知管理等,新增40+功能場景,充分考慮研發、運維、安全以及營運人員的告警監控運維需求。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

1.3. 五大優勢

使用SLS新版告警,可以有效緩解前面提到的告警運維系統的痛點,和其他自建、商業化或雲廠商提供的方案比,具備如下5大優勢:

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

2. 20類功能場景展示

場景樣例1:日志、時序、跟蹤一套查詢分析文法

對日志、名額、跟蹤等資料,提供一套通用文法,SLS告警監控的支援大規模日志/時序/跟蹤等實時監控,而查詢統計文法也是使用通用統一的SQL(并擴充)的方式提供。也就是SQL = Search + PromQL + SQL92。

例如對特定機器是否線上監控,可以使用SQL、PromQL、或者兩者子查詢協同、甚至多層嵌套使用機器學習的算法來找出異常。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例2:豐富的機器學習算法支援

SLS的機器學習算法是直接在SQL擴充方式提供,覆寫了以下4個場景:

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例3:全局監控

不需要同步資料到本地,即可跨庫、跨區域、甚至跨賬号的監控并告警。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例4:多資料源協同

支援多個(可不同)資料源之間的協同

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例5:多目标監控與黑白名單

一條規則可以同時監控日志/時序庫中的多個邏輯目标,可分開告警,且支援自定義白名單或黑名單(隻針對多目标監控時自動專注或排除)。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例6: 動态設定告警嚴重度

支援根據檢測值動态設定告警的嚴重度。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例7:内置告警監控規則庫

内置各場景下告警規則庫 (500+),開箱即用,且持續增加中。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例8:告警靜默

可以基于告警來源規則的屬性(區域、項目、規則名等),也可以基于告警自身的屬性(狀态、标簽、标注、嚴重度等)抑制告警。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例9:告警抑制

一個告警可以抑制(忽略)其他的告警,可有效阻止因為一次嚴重告警觸發的告警風暴。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例10:路由合并降噪

支援将告警歸類分派到多個合并集合中,進一步的降噪控制(去重、合并等)後,合并發送(通過行動政策)。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考
  • 在合并集合中,多個告警重複發送會自動去重,在集合首次、變化時發送,或不變時延遲發送。
這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例11:事件(Incident)階段管理

自動給告警建立事件(Incident),可對其确認、解決、忽略、設定處理人、注釋等操作。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例12:告警态勢大盤

提供多張告警态勢大盤:監控規則中心、告警鍊路中心、告警排錯中心、監控規則執行報表等。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例13:通知管道分派

可以自由按照告警的屬性,将對告警分派給不同人和管道。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例14: 月曆與工作時段感覺

可以自定義月曆的時區、工作時段、自動同步節假日,亦可重置。通知管道自動感覺。

  • 案例: 發生告警時,工作日發送短信、釘釘、郵件;法定假日(如國慶長假)和周末時僅發送郵件。
  • 案例: 發生嚴重告警時,工作時段發短信、釘釘、郵件;非工作時段額外打電話。
這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例15:告警通知更新

在事件(Incident)一直處于特定未完成狀态時可觸發通知更新(例如直接打電話、或通知組長等)。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例16:獨立的接收人/組管理

  • 支援獨立的接收人、組的管理。
這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例17:值班組/表-輪崗

  • 支援建立值班組,選擇特定的時間段、對象(可以是組)、輪崗、交班方式後,自動排班。
這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考
  • 可預覽最終排班效果:
這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考
  • 亦可按細膩度分排班:
這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考
  • 可以針對特定不連續的時間段排班
這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景樣例18:值班組/表-代班

值班人員臨時不能值班時,可由他人代班,自動替代原有值班人員值班,可預覽效果。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景案例19:内置管道擴充

  • 原生内置支援語音(電話)、短信、郵件、釘釘(群機器人)、阿裡雲管理者消息中心等
  • 短信、語音(電話)支援國際手機号。
  • 支援Webhook靈活定制,可支援企業微信、Slack、飛書等通知管道。
這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考
  • 提供内容模闆定制格式、甚至可以引用變量
這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

場景案例20:管道額度控制

支援設定預設、特定人、特定組的短信、郵件、語言的管道額度,且支援隔離控制。

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

3. 進一步參考

這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考
  • 後續系列直播與教育訓練視訊會同步到B站,敬請留意
這才是可觀測告警運維平台——20個SLS告警運維場景前言1. 新版SLS告警介紹2. 20類功能場景展示3. 進一步參考

繼續閱讀