動态規劃(孫小玲老師課件)
概念:
動态規劃是一種求解多階段決策問題的方法。這種多階段問題可以分為n個stages,每個stage又有各種狀态。動态規劃的目的是以Forward或者Backward的方式在每一個階段進行決策,即選擇某個狀态,以使最後一個決策做出後整個多階段問題處于一種最優的決策狀态。
依托理論:
最優性原理(the principle of optimality)
1、給定最優的一連串決策或者選擇,每一個字串也必定是最優的。
2、最優性原理隻能應用于多階段決策問題,但是并不是所有的多階段決策問題。
3、States是每個階段可能的決策,Stages是需要做出決策的階段。