天天看點

《中國人工智能學會通訊》——11.35 線性系統最優跟蹤控制

由于在現實中具有很廣泛的應用價值,最優跟蹤問題一直是控制界學者研究熱點之一[14-16] 。最優跟蹤控制的任務就是設計一個最優跟蹤控制器,使得系統的輸出以一種最優的方式跟蹤上一個參考軌迹[1] 。根據文獻 [1] 可知,對于連續時間線性系統而言,最優跟蹤控制器由一個線性回報項和一個前饋項構成。線性回報項是與一個代數 Riccati 方程相關,而線性前饋項依賴于由參考軌迹信号驅動的伴随閉環系統的輸出。這樣,求解最優跟蹤問題顯得過于冗雜。這是因為不僅需要求解一個代數 Riccati方程,還要求解一個非因果輔助微分方程。此外,因為代數 Riccati 方程和非因果輔助方程都包含系統的動态知識,求解最優跟蹤問題要求系統必須是已知,否則就無法得到系統的最優跟蹤控制器。由于代數 Riccati 方程隻能通過離線疊代的方式求解,這樣導緻無法利用系統線上實時資料來得到系統的最優跟蹤控制器。因而,設計動态知識未知連續時間線性系統的線上最優跟蹤控制仍然是個挑戰。

基于此考慮,我們提出一個基于 ADP 最優跟蹤控制方案,有效解決了動态知識未知連續時間線性系統的最優跟蹤問題。首先将原系統和參考軌迹動态系統建構成一個新增廣系統,進而把原系統的最優跟蹤問題轉化增廣系統的最優調節控制問題。在具有相同的性能名額函數的情況下,給出了增廣系統的代數 Riccati 方程,進而根據增廣代數Riccati 方程能夠以一種因果關系同時,得到原系統最優跟蹤控制器的回報項和前饋項,并證明了增廣系統的最優控制解等價于原系統的最優跟蹤控制問題的标準解。然後,基于 ADP 技術,給出了一種新的線上資料驅動 ADP 算法,以實作線上求得動态知識未知連續時間線性系統的最優跟蹤控制器。

繼續閱讀