《中國人工智能學會通訊》——11.37 非線性切換系統最優控制

2021-11-10 16:36:55

在現實世界中具有廣泛的應用，切換系統一直是控制界學者的研究的熱點[28-31] 。然而大多數切換系統的執行器具有飽和非線性，這是由于實際的執行器都存在實體特性的限制。如果忽略飽和特性的影響，那麼不僅會導緻降低閉環系統的性能，還有可能導緻系統的不穩定，因而引起了許多學者的研究興趣，出現了許多研究成果[32-34] 。然而，目前研究成果隻是注重了帶有執行飽和的切換系統的穩定性，卻沒有考慮系統的最優控制問題。

對于切換系統的最優控制問題，不僅需要設計切換系統的最優回報控制，還要設計切換系統的最優切換序列[35-39] 。另外，切換系統的哈密頓-雅可比-貝爾曼 (Hamilton-Jacobi-Bellman, HJB) 方程是一個具有多變量的非線性差分方程或微分方程，而求解這樣的 HJB 方程是十分困難的，很難得到方程的解析解[35] 。如果切換系統的執行器是飽和的 , 那麼相應的 HJB 方程是一個受限制的 HJB 方程 , 就更難得到其解析解。另一方面，現有解決切換系統的最優控制問題的方法[35,38]都是基于動态規劃的。而動态規劃是采用反向遞推求解最優問題，相應的計算量和存儲量會随着系統的複雜性的增加而急劇增加，形成所謂的動态規劃的“維數災”問題[13] ，這将導緻無法得到最優解[28] 。

為此，我們給出了一種疊代兩級二次啟發式規劃 (Dual Heuristic Programming, DHP) 算法來解決帶有飽和執行器的離散非線性切換系統的最優控制問題。首先，利用一個非二次型泛函解決執行飽和問題，并給出切換系統的限制 HJB 方程，保證所得到的最優控制函數在飽和執行器内是光滑函數。其次，基于兩級最優法和疊代二次啟發式規劃算法，推導出一種新異的疊代兩級 DHP 算法用來求解限制 HJB 方程。在疊代兩級 DHP 算法中，每步疊代的協狀态函數是由一組光滑函數的集合表征的。并證明了通過疊代兩級 DHP 算法得到的值函數序列收斂于 HJB 方程最優代價函數。為了執行疊代算法，通過利用神經網絡作為參數結構來分别近似協狀态函數和控制律，并給出疊代求解的具體步驟。

《中國人工智能學會通訊》——11.37 非線性切換系統最優控制

繼續閱讀

開源低帶寬語音編解碼器

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希