天天看點

時序資料庫DolphinDB基于機器學習的異常預警方案

作者:媒體的深耕者

資料異常預警在工業安全生産中是一項重要工作,對于監控生産過程的穩定性、保障生産資料的有效性、維護生産裝置的可靠性具有重要意義。随着大資料技術在生産領域的深入應用,基于機器學習的智能預警已經成為各大生産企業進行生産資料異常預警的一種有效解決方案。

什麼是智能預警?

智能預警就是利用機器學習的算法,通過大資料監測和分析,預測名額趨勢、識别異常迹象,向運維人員發出預警,進而做到提前有效規避故障。例如在一個大型風電廠,風機監控人員需要實時監控并盡量保證發電量的平穩性。當檢測到風機發電量可能出現異常時,監控人員需要遠端實時調整風機參數以維持發電量的平穩。我們來拆解一下這個場景。首先,資料采集是後續分析和預測的基礎。我們需要選擇能夠合理衡量風機發電穩定性的名額,采集這些名額資料并存儲到資料庫中,然後進行監測分析。第二步是模型預測。當裝置資料源源不斷采集落庫時,我們需要通過模型訓練對未來一段時間的風機發電量進行實時預測。這裡就要用到各種機器學習算法,例如較簡單的 KNN ( K-NearestNeighbor ) 監督學習算法,又叫 K 鄰近算法,既可以用于分類計算,也可以用于模型回歸。

如何判斷是否會出現異常?

這就需要我們将未來發電量與目前發電量進行異常比對,并設定一個預警的門檻值。當異常率超過一定門檻值時,機器就會向風機監控人員遠端報警。當然,異常率也可以通過 Grafana 面闆 更直覺地可視化展示出來。

實時資料異常率預警的實作

時序資料庫DolphinDB基于機器學習的異常預警方案

關注DolphinDB公衆号了解上圖所示的完整方案。

DolphinDB + 機器學習 一套解決方案

在這個解決方案中,我們将複雜的真實場景進行了簡化,選取了風速、濕度、氣壓、溫度和裝置使用壽命這五個名額來指代影響風機發電的主要因素。同時,由于生産資料的敏感性,進行了 DolphinDB 資料仿真操作,使用模拟資料代替真實記錄集。

- 裝置數目:100台

- 時間機關:毫秒級 (1 ms = 0.001 s)

- 單台裝置采集資料傳輸量:1條/ms

- 總采集資料傳輸量:10萬條/s

當生産任務開啟後,模型預測任務與預警計算任務将同步開啟。運維人員可登入 Grafana,實時監控異常情況,并根據預警結果實時調整風機裝置參數。

時序資料庫DolphinDB基于機器學習的異常預警方案

各時段的異常率

時序資料庫DolphinDB基于機器學習的異常預警方案

檢視各時段的預警情況(0不進行預警,1進行預警)

從這一個簡單的物聯網企業生産場景中,我們可以看到,利用 DolphinDB 的存儲引擎、内置的機器學習架構算法以及插件,可以實作從資料采集監測、建構回歸模型到實時資料異常預警的業務全流程。感興趣的小夥伴可以關注DolphinDB公衆号,檢視完整解決方案~

繼續閱讀