一篇講解RNN輸出與狀态之間差別的文章,很多手繪講解圖:https://zhuanlan.zhihu.com/p/28919765
以下圖檔摘自https://www.jianshu.com/p/f3bde26febed
RNN結構圖:
内部循環展開的為hidden state,即ht
![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLiAzNfRHLGZkRGZkRfJ3bs92YsYTMfVmepNHL90TUNNzZq5UNz1WZyB3MMBjVtJWd0ckW65UbM5WOHJWa5kHT20ESjBjUIF2X0hXZ0xCMx81dvRWYoNHLrdEZwZ1Rh5WNXp1bwNjW1ZUba9VZwlHdssmch1mclRXY39CXldWYtlWPzNXZj9mcw1ycz9WL49zZuBnLyQjMzQzN0YTM0ATMwAjMwIzLc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
LSTM分解步驟圖:
C(cell state)為貫穿整個循環過程中的狀态(Ct為t時刻狀态),包括了所有的狀态。我個人了解相當于貫穿始終的倉庫。
并且整個過程由遺忘門,輸入門,輸出門來控制Ct的增加與删除。
- 遺忘門控制 保留多少Ct-1
- 輸入門控制 從ht-1和xt-1中增加多少東西到Ct-1中,兩者構成Ct
- 輸出門控制 從Ct中選取多少内容作為新的t時刻的輸出,即ht
對于一個LSTM單元來說,輸入xt,ht-1,Ct-1 ,輸出ht,Ct
具體見下圖: