今天研究了一下機器學習,發現裡面出現了一個參數叫
batch_size
。那麼什麼是
batch_size
呢?
batch_size
:表示單次傳遞給程式用以訓練的參數個數。比如我們的訓練集有
1000
個資料。這是如果我們設定
batch_size=100
,那麼程式首先會用資料集中的前
100
個參數,即第
1-100
個資料來訓練模型。當訓練完成後更新權重,再使用第
101-200
的個資料訓練,直至第十次使用完訓練集中的
1000
個資料後停止。
那麼為什麼要設定
batch_size
呢?
優勢:
- 可以減少記憶體的使用,因為我們每次隻取
個資料,是以訓練時所使用的記憶體量會比較小。這對于我們的電腦記憶體不能滿足一次性訓練所有資料時十分有效。可以了解為訓練資料集的分塊訓練。100
- 提高訓練的速度,因為每次完成訓練後我們都會更新我們的權重值使其更趨向于精确值。是以完成訓練的速度較快。