天天看點

火山引擎DataLeap如何解決SLA治理難題 三:平台架構與未來展望

作者:位元組跳動資料平台
更多技術交流、求職機會,歡迎關注位元組跳動資料平台微信公衆号,回複【1】進入官方交流群

平台架構總結

火山引擎 DataLeap SLA平台整體主要分為基礎元件、規劃式治理服務、響應式治理服務三大塊,系統元件架構圖如下:

火山引擎DataLeap如何解決SLA治理難題 三:平台架構與未來展望

規劃式治理服務

所謂“規劃式治理”,即在問題發現前治理,通過主動規劃約定SLA的形式保障任務産出。規劃式治理是SLA相關問題發現的過程。

規劃式治理服務即“提供以申報單簽署的方式達成SLA協定的服務”,包括在此過程中申報單的生命周期管理操作,申報任務的鍊路分析,以及達成SLA之後的系統保障監控,服務于“申報簽署流程”。

響應式治理服務

響應式治理是指通過複盤管理子產品對SLA相關的事故/問題進行登記、管理、複盤的過程。在發現SLA相關問題之後,需要對問題進行處理,形成一個完整的閉環,在發現問題後進行的治理成為響應式治理。

響應式治理服務子產品抽象出問題登記和事故管理兩個子產品,更加靈活的服務于資料SLA的問題歸因與事故統計。

基礎元件

基礎元件提供了配置、播報、看闆等基本功能子產品服務,為規劃式、響應式治理服務提供了必要支撐,是整體SLA保障服務不可或缺的一環。

(1)系統配置

  • 治理團隊配置

治理團隊為SLA的管理團隊,每個申報單都需要綁定一個治理團隊,治理團隊主要負責審批申報單。

火山引擎DataLeap如何解決SLA治理難題 三:平台架構與未來展望
  • 資料團隊配置

資料團隊為資料的歸屬方,一個資料團隊對應一個業務團隊,資料團隊的設計保障了各個業務團隊獨立治理的需求。平台通過對資料團隊的靈活配置支援,可以更細粒度的劃分資料與任務的歸屬,解決權責不清的問題。

  • 訂閱配置

訂閱管理是配置訂閱資訊的平台,本平台的訂閱為SLA監控的通知播報,通過訂閱管理可以将通知指定發動到個人或者群組。訂閱管理是火山引擎DataLeap SLA監控保障服務不可或缺的一環。

火山引擎DataLeap如何解決SLA治理難題 三:平台架構與未來展望

(2)通知播報

通知播報是本平台所提供的基礎通知能力,是降低溝通成本、實作保障服務、提升使用者體驗的重要手段。在重要節點變更、使用者操作、SLA狀态變化等情況下,都會進行通知播報。通知播報形式多樣,根據不同的場景,有普通文本消息、加急消息、卡片通知、郵件通知、電話通知等。

(3) SLA大盤展闆

SLA大盤展闆是資料治理方最為關心的部分,展闆提供當日SLA整體統計資訊、SLA延遲趨勢分析資訊、SLA等級分布明細、任務健康度明細、團隊SLA達成資訊統計等豐富資訊,是很多團隊資料治理名額重要參照來源。

未來展望

未來位元組跳動資料治理團隊将持續打磨火山引擎DataLeap SLA保障平台,在卡點政策優化、SLA推薦算法優化、基于SLA的任務管理機制上持續提升技術能力:

  • 卡點政策優化:卡點計算作為優化簽署流程中核心一環,卡點政策優化代表着簽署流程進一步的簡化,未來可以探索利用更多有效的資訊優化卡點政策。
  • SLA推薦算法優化:SLA推薦算法是本平台的核算算法之一,已經申請了專利。随着業務的拓展,以及不同種類任務的支援,此算法還有廣闊的提升空間,如進一步提升自動簽署率,進一步提升準确率等。
  • 基于SLA的任務管理機制:任務簽署SLA資訊之後,即可依托SLA資訊進行資源排程優化,并進行資源配置設定傾斜。

同時,文中闡述的部分能力已經通過火山引擎DataLeap産品向企業客戶開放,歡迎關注。

點選跳轉大資料研發治理套件-火山引擎了解更多

繼續閱讀