時序資料庫DolphinDB基于機器學習的異常預警方案

2023-05-29 16:28:00

資料異常預警在工業安全生産中是一項重要工作，對于監控生産過程的穩定性、保障生産資料的有效性、維護生産裝置的可靠性具有重要意義。随着大資料技術在生産領域的深入應用，基于機器學習的智能預警已經成為各大生産企業進行生産資料異常預警的一種有效解決方案。

什麼是智能預警？

智能預警就是利用機器學習的算法，通過大資料監測和分析，預測名額趨勢、識别異常迹象，向運維人員發出預警，進而做到提前有效規避故障。例如在一個大型風電廠，風機監控人員需要實時監控并盡量保證發電量的平穩性。當檢測到風機發電量可能出現異常時，監控人員需要遠端實時調整風機參數以維持發電量的平穩。我們來拆解一下這個場景。首先，資料采集是後續分析和預測的基礎。我們需要選擇能夠合理衡量風機發電穩定性的名額，采集這些名額資料并存儲到資料庫中，然後進行監測分析。第二步是模型預測。當裝置資料源源不斷采集落庫時，我們需要通過模型訓練對未來一段時間的風機發電量進行實時預測。這裡就要用到各種機器學習算法，例如較簡單的 KNN ( K-NearestNeighbor ) 監督學習算法，又叫 K 鄰近算法，既可以用于分類計算，也可以用于模型回歸。

如何判斷是否會出現異常？

這就需要我們将未來發電量與目前發電量進行異常比對，并設定一個預警的門檻值。當異常率超過一定門檻值時，機器就會向風機監控人員遠端報警。當然，異常率也可以通過 Grafana 面闆更直覺地可視化展示出來。

實時資料異常率預警的實作

關注DolphinDB公衆号了解上圖所示的完整方案。

DolphinDB + 機器學習一套解決方案

在這個解決方案中，我們将複雜的真實場景進行了簡化，選取了風速、濕度、氣壓、溫度和裝置使用壽命這五個名額來指代影響風機發電的主要因素。同時，由于生産資料的敏感性，進行了 DolphinDB 資料仿真操作，使用模拟資料代替真實記錄集。

- 裝置數目：100台

- 時間機關：毫秒級（1 ms = 0.001 s）

- 單台裝置采集資料傳輸量：1條/ms

- 總采集資料傳輸量：10萬條/s

當生産任務開啟後，模型預測任務與預警計算任務将同步開啟。運維人員可登入 Grafana，實時監控異常情況，并根據預警結果實時調整風機裝置參數。

各時段的異常率

檢視各時段的預警情況（0不進行預警，1進行預警）

從這一個簡單的物聯網企業生産場景中，我們可以看到，利用 DolphinDB 的存儲引擎、内置的機器學習架構算法以及插件，可以實作從資料采集監測、建構回歸模型到實時資料異常預警的業務全流程。感興趣的小夥伴可以關注DolphinDB公衆号，檢視完整解決方案～

時序資料庫DolphinDB基于機器學習的異常預警方案

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告