天天看點

ScheduledSQL告警配置

背景

阿裡雲日志服務緻力于為使用者提供統一的可觀測性平台,同時支援日志、時序以及Trace資料的查詢存儲。為了友善使用者計算聚合資料,或者根據日志資料計算服務名額,日志服務推出了Scheduled SQL功能。Scheduled SQL支援定時分析資料、存儲聚合資料、投影與過濾資料。為了友善使用者觀察Scheduled SQL任務的執行情況,日志服務為Scheduled SQL增加了告警功能,本文主要向使用者介紹如何開啟Scheduled SQL告警,以及追蹤任務的執行情況,友善使用者及時發現異常情況。

執行日志

開通執行日志

  1. 在Scheduled SQL任務所在Project的概覽頁面,點選開通服務日志。
ScheduledSQL告警配置
  1. 點選作業告警日志按鈕,開通Scheduled SQL執行日志。
ScheduledSQL告警配置

開通作業告警日志之後,在對應project下的internal-diagnostic_log,就可以檢視到Scheduled SQL的執行日志了。

檢視執行日志

在控制台查詢頁面輸入

* and __topic__: scheduled_sql_alert 

可以檢視Scheduled SQL的執行日志,每個任務執行個體的執行情況均可以檢視。

ScheduledSQL告警配置

字段說明

字段 說明 示例
project 任務所在的project名稱 my-project-name
job_name 任務名稱 sql-16xxxxxxx-xxxxxx
uid 主賬戶阿裡雲UID
schedule_id 排程配置辨別
job_type 任務類型,目前恒為ScheduledSQL
instance_id 任務執行個體辨別
create_time 任務執行個體建立時間,機關為秒
schedule_time 任務執行個體排程時間,機關為秒
trigger_time 任務執行個體觸發時間,機關為秒
status 任務執行個體執行結果,可以為FAILED或者SUCCEEDED
error_code 如果執行個體執行失敗,說明失敗原因 SQLFailed
error_message 如果執行個體執行失敗,說明失敗詳情 sql syntax error
fallbehind 任務觸發時間和排程時間間隔,說明執行延遲,機關為秒 85
succeed_lines 如果執行個體成功,說明寫入行數;如果執行個體失敗,則為0 100

告警規則

通過監控任務執行日志,可以配置告警規則監控任務的執行情況。使用者可以自定義告警規則,也可以使用内置的Scheduled SQL告警規則。

開啟新版告警

在執行日志所在的project,點選左側的告警按鈕打開告警中心,開啟新版告警服務。

ScheduledSQL告警配置

行動政策

點選告警管理标簽頁,在下拉框中點選行動政策,打開行動政策編輯框。可以看到SLS Scheduled SQL内置行動政策。點選右側的修改按鈕,在第一行動清單中添加想要的通知方式,目前支援十多種通知管道。更多關于行動政策的資訊,可以參考

官方文檔

。當然,使用者也可以選擇自定義Scheduled SQL告警的行動政策,通過點選添加按鈕添加新的額行動政策。

ScheduledSQL告警配置

内置告警

ScheduledSQL告警配置

在告警中心的規則視圖頁面,選中SLS ScheduledSQL複選框,篩選出内置告警規則。點選右側的添加按鈕,在彈出視窗中填寫告警配置,即可完成告警規則的配置。這裡需要注意内置告警規則評估間隔為5分鐘。

配置
告警名稱 告警執行個體名稱 xxx任務錯誤監控
監控的Project ScheduledSQL任務所在的Project,.*表示監控所有Project
監控的任務名稱 需要監控的ScheduledSQL任務名稱,注意非顯示名稱;.*表示監控所有任務 sql-123456-1234
行動政策小節中配置的行動政策,預設使用内置行動政策
嚴重度 告警嚴重度

自定義告警

如果内置告警規則不符合需求,也可以自定義告警規則。可以通過點選建立告警按鈕,建立自定義告警。關于自定義告警的配置詳情,可以參考

ScheduledSQL告警配置

事件管理

配置完告警規則,就可以在ScheduledSQL任務異常時收到告警。點選告警中心頁面右側的事務視圖按鈕,可以檢視曆史告警事件。

ScheduledSQL告警配置

總結

Scheduled SQL為使用者周期性的進行分析資料、存儲聚合資料、投影與過濾資料提供了較大的便利。為了避免任務執行失敗引發問題,建議開啟Scheduled SQL告警功能,能夠及時處理出現的問題。