CS231n簡介

詳見 CS231n課程筆記1：Introduction。

本文都是作者自己的思考，正确性未經過驗證，歡迎指教。

作業筆記

本部分實作的是Momentum，RMSProb, Adam三種優化算法，優化算法是用于從随機點出發，逐漸找到局部最優點的算法。關于各種優化算法的詳細介紹，請參考CS231n課程筆記6.1：優化疊代算法之SGD,Momentum,Netsterov Momentum,AdaGrad,RMSprop,Adam。

1. Momentum

方程：

v = mu*v - learning_rate*dx
x += v

代碼：

v = v*config['momentum']-config['learning_rate']*dw
  next_w = w + v

2. RMSProp

方程：

cache = cache*decay_rate + (-decay_rate)*dx*dx
x -= learning_rate * dx/(sqrt(cache)+e-)

代碼：

config['cache'] = config['cache']*config['decay_rate'] + (-config['decay_rate'])*dx*dx
  next_x = x - config['learning_rate']*dx/np.sqrt(config['cache']+config['epsilon'])

3. Adam

此算法需要注意的是ppt中的方程是錯誤的，正确方法如下圖，主要差別在于bias correction的部分，不更新m和v，詳見Adam: A Method for Stochastic Optimization

還要注意t的更新，此部分也沒有顯示的寫在ppt裡。

CS231n作業筆記2.3：優化算法Momentum, RMSProp, AdamCS231n簡介作業筆記

代碼：

m = config['m']*config['beta1']+(-config['beta1'])*dx
  v = config['v']*config['beta2']+(-config['beta2'])*dx*dx
  config['t'] += 
  mb = m / ( - config['beta1']**config['t'])
  vb = v / ( - config['beta2']**config['t'])
  next_x = x - config['learning_rate']*mb/(np.sqrt(vb)+config['epsilon'])
  config['m'] = m
  config['v'] = v

CS231n作業筆記2.3：優化算法Momentum, RMSProp, AdamCS231n簡介作業筆記

CS231n簡介

作業筆記

1. Momentum

2. RMSProp

3. Adam

繼續閱讀

Efficient Quadratic Ising Hamiltonian Generation with Qubit Reduction——論文欣賞

樹形依賴背包的兩種實作形式

布谷鳥算法詳細講解

淺分享～靜待看，留心賞💗插畫師AdamHowling繪畫作品|

智能優化算法Matlab源碼大禮包領取

行列式、奇異矩陣、矩陣範數、條件數、AdaGrad

對偶單純形算法

1~n 整數中 1 出現的次數

優化算法(四)——粒子群優化算法(PSO)

優化算法小結對比梯度下降，牛頓法，高斯牛頓

基于果蠅算法優化無線傳感器覆寫優化FOA-WSN附matlab代碼

阿基米德優化算法AOA附Matlab代碼

遺傳算法及其實作遺傳算法的思想

算法篇----簡易版的粒子群（PSO）實作（Matlab語言）前言1 定義變量2 初始化種群3 計算粒子适應度4 更新個體最優值5 更新全局最優值6 更新粒子的速度和位置7 适應度函數8 完整代碼9 實驗結果

群聊天記錄，關于優化算法

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡