天天看點

【資料産品案例】攜程新一代呼叫中心話務監控平台

案例來源:@攜程技術中心 案例位址: https://zhuanlan.zhihu.com/p/32650533

1. 原話務平台面臨的問題 1)人工設定告警規則,無法适應業務變化 2)小業務量監控項多、資料量小,難以設定有效規則 3)誤報 4)告警風暴:大型故障發生産生告警風暴,影響排障效率

2. Horus解決方案 1)自動檢測: a. 首先進行跌零檢測,如資料跌零切累計損失話務量滿足規定次數,告警 b. 未跌零的情況下,判斷資料是否超過上下門檻值(門檻值根據曆史資料正态分布計算,即上下n個标準差範圍) c. 超過上下門檻值的情況下,判斷變化率是否超過規定值,超過告警

【資料産品案例】攜程新一代呼叫中心話務監控平台

3. 應用場景 1)話務量檢測:檢測各号碼的話務量是否異常 2)成功率檢測:檢測外呼成功率 3)周期性特征檢測:有一些話務有周期特征,分析規律,避免誤報 4)小話務量處理:将其按照一小時聚集,使波動變小,可以進行自動檢測。缺點是監控次元為1小時,從問題發生到告警會有延遲 5)關聯告警:有一些監控項之間存在關聯,如傳真請求量與傳真發送量,如果前者報警後,後者也增加,則不報警,認為是一次事件 6)長期小幅下跌:計算累計影響話務量,進行預警 7)告警聚合:同類報警項,聚合成一個通知

繼續閱讀