Keras手冊記錄之optimizer，待更新各個算法詳解！

2023-03-07 05:59:28

optimizer：https://keras.io/optimizers/

下面recommended to leave the parameters of this optimizer at their default values的優化算法，名字旁邊打星号

SGD

keras.optimizers.SGD(lr=0.01, momentum=0.0, decay=0.0, nesterov=False)

RMSprop 适用于RNN*

keras.optimizers.RMSprop(lr=0.001, rho=0.9, epsilon=None, decay=0.0)

連結：http://www.cs.toronto.edu/~tijmen/csc321/slides/lecture_slides_lec6.pdf

Adagrad*

keras.optimizers.Adagrad(lr=0.01, epsilon=None, decay=0.0)

Adagrad is an optimizer with parameter-specific learning rates, which are adapted relative to how frequently a parameter gets updated during training. The more updates a parameter receives, the smaller the learning rate.

連結：http://www.jmlr.org/papers/volume12/duchi11a/duchi11a.pdf

Adadelta，a more robust extension of Adagrad*

keras.optimizers.Adadelta(lr=1.0, rho=0.95, epsilon=None, decay=0.0)

連結：https://arxiv.org/abs/1212.5701

Adam

keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=None, decay=0.0, amsgrad=False)

連結：

https://arxiv.org/abs/1412.6980v8

https://openreview.net/forum?id=ryQu7f-RZ

Adamax，a variant of Adam based on the infinity norm

keras.optimizers.Adamax(lr=0.002, beta_1=0.9, beta_2=0.999, epsilon=None, decay=0.0)

連結同adam

Nadam*，Much like Adam is essentially RMSprop with momentum, Nadam is Adam RMSprop with Nesterov momentum.

keras.optimizers.Nadam(lr=0.002, beta_1=0.9, beta_2=0.999, epsilon=None, schedule_decay=0.004)

連結：

http://cs229.stanford.edu/proj2015/054_report.pdf

http://www.cs.toronto.edu/~fritz/absps/momentum.pdf

Keras手冊記錄之optimizer，待更新各個算法詳解！

下面recommended to leave the parameters of this optimizer at their default values的優化算法，名字旁邊打星号

SGD

RMSprop 适用于RNN*

Adagrad*

Adadelta，a more robust extension of Adagrad*

Adam

Adamax，a variant of Adam based on the infinity norm

Nadam*，Much like Adam is essentially RMSprop with momentum, Nadam is Adam RMSprop with Nesterov momentum.

繼續閱讀

Deep Learning的幾個經典網絡 ----持續更新中

Dropout:A Simple Way to Prevent Neural Networks from Overfitting

[文獻閱讀]dropout - a simple way to prevent neural networks from overfitting

keras入門一

Keras-3 Keras With Otto GroupOtto 分類問題

Pytorch學習筆記-第五章資料處理可視化工具GPU加速cuda固化資料

GoogleNet網絡詳解與keras實作GoogleNet網絡詳解與keras實作

unet-keras完整訓練流程Unet-keras完整訓練流程模型預測

keras Unet 細胞分割邊緣檢測代碼走讀

遷移學習相關資料Transfer learning applications

ul、ol、dl的差別語義差別樣式差別

用 Keras/TensorFlow 2.8 建立 COCO 的 average precision 名額前言1. AP 的算法原理。2. 在 Keras 中的實作。3. 建立狀态量。4. update_state 方法。5. result 方法。6. 測試盒 testcase。7. 使用方法。8. 下載下傳連結。THE END

SoftMax與交叉熵損失

基于keras的多GPU深度學習網絡模型及參數儲存-筆記

Linux環境下 TensorFlow的安裝和使用基于Anaconda的tensorflow安裝

keras模型可視化pydot-ng 和 graphviz安裝問題(ubuntu)

Keras手冊記錄之optimizer， 待更新各個算法詳解！

下面recommended to leave the parameters of this optimizer at their default values的優化算法，名字旁邊打星号

SGD

RMSprop 适用于RNN*

Adagrad*

Adadelta，a more robust extension of Adagrad*

Adam

Adamax，a variant of Adam based on the infinity norm

Nadam*，Much like Adam is essentially RMSprop with momentum, Nadam is Adam RMSprop with Nesterov momentum.

繼續閱讀

Keras手冊記錄之optimizer，待更新各個算法詳解！