天天看點

視覺方面一些基礎知識

1.CNN為什麼可以在CV/NLP/Speech等領域都可以使用?

  1. 卷積是因為輸入資料的局部相關性;

  2. 權值共享是因為輸入資料的局部特征具有平移不變性,即在不同位置具有共性的局部特征。這樣,經過多層次堆疊,低層局部特征可以抽取成高層全局特征。

  3. 權值共享能夠降低參數量,而且降低了網絡的訓練難度。

    note: 如果權值不共享,那就是局部連接配接層了。在某些應用,如人臉在不同的區域存在不同的特征(眼睛/鼻子/嘴的分布位置相對固定),當不存在全局的局   部特征分布時,局部連接配接層更适合特征的提取。

2.采用pooling原因:

  1. 提取特征,保證invariance(translation(平移),rotation(旋轉),scale(尺度))      

  2. 減少參數減少計算量和防止過拟合