天天看點

動态規劃動态規劃(孫小玲老師課件)

動态規劃(孫小玲老師課件)

概念:

動态規劃是一種求解多階段決策問題的方法。這種多階段問題可以分為n個stages,每個stage又有各種狀态。動态規劃的目的是以Forward或者Backward的方式在每一個階段進行決策,即選擇某個狀态,以使最後一個決策做出後整個多階段問題處于一種最優的決策狀态。

依托理論:

最優性原理(the principle of optimality)

1、給定最優的一連串決策或者選擇,每一個字串也必定是最優的。

2、最優性原理隻能應用于多階段決策問題,但是并不是所有的多階段決策問題。

3、States是每個階段可能的決策,Stages是需要做出決策的階段。

繼續閱讀