天天看點

資料驅動控制及相關方法概述

資料驅動控制及相關方法概述

資料驅動控制概述

模型參考控制是目前控制系統設計的主流方法。其中,最具代表性的是模型參考自适應控制。隻要模組化足夠理想且精準,那麼根據需求和理論設定控制器,便可以達到所需的控制性能。然而實際情況是,模型通常是時變的、非線性的、不确定的,無法得到理想的精準模型。同時,控制器的設計還需要考慮有機械和傳感器等帶來的限制。控制系統的設計一般包括模型辨識、控制設計、性能評估三個環節,三者互相影響、互相疊代。模型的線性拟合辨識精度低會導緻與實際被控對象的偏差較大,進而控制器設計不準确,性能評估也難以起到疊代作用。或者為了減少模組化誤差,充分考慮時變性、非線性等,這也會導緻控制系統設計相當困難、實作相當複雜。加之機械特性、傳感器等限制的現實條件,最終可能導緻理論可行但實際難以實作。

資料驅動控制及相關方法概述

有沒有不需要模組化的方法,是指可以直接從現有資料入手,設計控制器呢?

無模型控制,也稱為資料驅動控制(Data-Driven Control),是一種不依賴于被控對象本身的數學模型,隻利用測量的輸入輸出資料集來設計控制器的控制方法。換句話說,在控制器設計過程中,無模型控制使用了很少或甚至沒有與被控對象本身有關的資訊。

資料驅動的控制技術通過性能名額來提高性能表現。這些名額通常在時間域中指定,例如超調量、穩定時間和上升時間,以積分或求和的目标函數進行聚合。通過将這些目标函數最小化,在限制優化問題中可以實作多種目标,例如參考軌迹跟蹤、控制輸入的限制以及擾動抑制。資料驅動的控制技術專注于在沒有或者隻有較少過程模型資訊的情況下實作性能,通過簡單而易于解釋的控制器(如行業中最流行的PI和PID控制器)來滿足性能規範。

神經網絡控制和模糊控制算不算資料驅動控制? 觀點1:神經網絡控制和模糊控制都屬于無模型控制。在這兩種控制方法中,沒有顯式的數學模型來描述受控系統的動态行為,而是通過對輸入-輸出資料關系的學習或根據模糊的知識和規則來進行控制決策。是以,這些方法也被稱為基于資料或經驗的控制方法。 觀點2:嚴格來說,神經網絡控制和模糊控制并不是無模型控制。網絡節點和隐層的選擇需要了解受控對象的一些資訊,而且神經網絡本身就是受控對象的一種模型,模型發生變化時是需要重新訓練以适應系統變化。同樣地,模糊控制也不算無模型控制,因為IF-THEN規則本身就是一種模型,需要深入了解受控系統,以便在系統發生大變化時重新制定規則。是以,根據無模型控制方法的定義,它們并不屬于無模型控制方法。 本人觀點:資料驅動控制本身就是一個較為寬泛的概念,神經網絡控制和模糊控制算不算資料驅動控制不同角度有不同的觀點,實際應用時可根據自己需要來定義,總之不管黑貓白貓,抓住老鼠就是好貓!
資料驅動控制及相關方法概述

握手言和

資料驅動控制的主要缺點是難以進行系統穩定性和魯棒性分析。換句話說,即使確定參考軌迹跟蹤的調整,也不能保證魯棒穩定性和魯棒性能。這是因為這些分析需要受控過程的詳細數學模型。盡管如此,術語“魯棒性”在基于模型的控制中指的是控制器對模組化錯誤不敏感的特性,但在資料驅動控制中通常會避免使用。由于資料驅動控制不需要模型,是以應澄清“魯棒性”一詞的使用。與資料驅動控制的穩定性相關的另一個缺點是它們的有效性受到測量噪聲的強烈影響。

相關方法

  • 無模型自适應控制(Model-Free Adaptive Control,MFAC) 利用線上資料來不斷更新自适應控制器參數
  • 疊代學習控制(Iterative Learning Control, ILC) 使用先前執行的控制結果來改善系統性能的控制方法。在一系列連續的疊代上,逐漸調整控制器的輸出,通過不斷的疊代來提高系統精度和穩定性。在每次疊代中,控制器收集執行過程中産生的誤差信号和過程輸出,以便在下一次疊代中進行更好的控制。通過重複進行疊代,系統可以逐漸消除由于測量誤差和非線性行為引起的控制誤差,最終實作高精度的控制.
資料驅動控制及相關方法概述
  • 疊代回報調節(Iterative Feedback Tuning, IFT) 使用周期性的試驗信号來收集系統響應,并根據收集到的資料來對控制器參數進行逐漸調整,以實作更好的控制性能。
  • 疊代相關性調諧(Iterative Correlation-based Tuning, ICbT) 基于系統的輸出信号和參考信号之間的相關性,以自适應地調整控制器參數。在每次疊代中,CbT方法會檢查輸出信号和參考信号之間的相關性,然後根據這個相關性來更新控制器參數以實作更好的控制性能。
資料驅動控制及相關方法概述

頻域調節同步擾動随機逼近(Frequency-domain Tuning with Simultaneous Perturbation Stochastic Approximation, FDSA-SPSA)

  • 根據控制器頻域響應的誤差信号來更新控制器參數
  • 疊代回歸調整(Iterative Regression Tuning, IRT) 使用回歸分析技術來計算最優的控制器參數
  • 強化學習(Reinforcement Learning, RL) 資料驅動的機器學習方法,通過與環境互動來學習适當的行為。智能體在環境中通過執行一個操作來擷取回報信号,然後通過回報信号來學習如何做出更好的決策。通過試錯并且逐漸提高自己,智能體最終可以學會如何優化某種特定的目标。Q-learning算法,使用Q值函數來記錄每種行動的預期回報,并通過選擇最高Q值的行為來最大程度地優化行動政策。在機器人控制、遊戲AI、自動駕駛等領域中得到了廣泛應用。
資料驅動控制及相關方法概述
  • 去僞控制(Unfalsified Control, UC) 首先構造一組可能滿足性能要求的可行控制器集合基于新資料進行疊代判别是否滿足要求。一旦新資料否定目前控制器,則自動切換到新的控制器。用優化算法來縮小可行控制器範圍,UC方法實質上是一種切換控制方法
資料驅動控制及相關方法概述
  • 惰性學習(Lazy learning,LL) 學習方法不同,不直接建構一個模型,而是推遲學習過程,等待新的輸入資料進來再進行學習和預測性學習方法主要分為兩類:近鄰方法和核密度估計方法3 近鄰方法是根據距離度量選取目标樣本附近的一些訓練樣本進行預測,如K-最近鄰算法核密度估計方法是通過某一個樣本點所在區域内的訓練樣本來推測該樣本的類别 靈活、高效、可解釋性強和容易擴充,尤其适用于具有複雜度高且不規則的問題容易受到噪聲資料和樣本不平衡問題的影響,需要對資料進行預處理和優化
  • 自抗擾控制(Active Disturbance Rejection Control,ADRC) 擴充狀态觀測器+非線性控制律+跟蹤微分器
  • 資料驅動的預測控制(Data-driven predictive control) 核心思想是通過分析系統的資料,找出系統的動态規律和關聯規則,然後預測未來系統的運作狀态并采取控制行動。重點在于利用曆史資料和實時資料來預測未來的系統行為,并根據該預測結果進行控制
資料驅動控制及相關方法概述
  • 資料驅動逆向控制(Data-Driven Inversion-Based Control,D2-IBC) 使用資料驅動方法建構逆動态模型,然後使用模型預測控制算法解決系統的控制問題主要目的是在控制精度和執行效率之間找到良好的平衡PS:D2-IBC注重控制器的實時回報控制,而資料驅動的預測控制注重利用資料預測未來的系統行為并實作長期控制。
  • 極值搜尋控制(Extremum Seeking Control, ESC) 基于疊代尋優的自适應控制方法,旨在實作最優化控制核心思想是通過尋找控制對象的回報信号中的極值點,直接估算并實作系統的最優化控制極值搜尋控制方法主要包括兩個步驟:搜尋和調整 通過改變控制器的輸入信号以及對控制對象的回報信号進行采樣,進而實作對極值點的搜尋在搜尋到極值點之後,将其作為回報控制器的輸入信号,進行控制器的調整,以實作最優化控制 具有快速響應、精細控制等優點
資料驅動控制及相關方法概述
  • 基于脈沖響應的控制(Pulse response-based control) 通過分析系統的脈沖響應,建立系統的數學模型,然後根據該模型設計優化控制器使用脈沖信号來激勵系統,并測量系統的脈沖響應。通過分析和處理脈沖響應資料,建立系統的傳遞函數或狀态空間模型PS:與工程上應用最多的根據頻率響應辨識被控對象傳遞函數的方法相同,嚴格來講不算是資料驅動控制

部分圖檔來源于網際網路,侵删

歡迎關注維信公号:控我所思VS制之以衡,擷取更多有用知識!

繼續閱讀