VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION
VGG-net
論文連結: https://arxiv.org/abs/1409.1556v6
一、 Problem Statement
作者研究了網絡的深度,與精度的關系。發現通過使用3x3卷積增加網絡深度可以提升精度。
二、 Direction
增加網絡深度。
三、 Method
兩個3x3卷積層(在中間沒有spatial pooling)堆疊在一起的感覺域是5x5,而三個3x3卷積層堆疊在一起的感覺域是7x7。是以作者發現,使用一個7x7卷積層和使用三個3x3卷積層堆疊在一起有以下優點:
- 三個卷積層之間可以多插入三個recitification layers,這使得決策函數更具區分性。
-
減少了參數量。
假設三個3x3卷積層有 C C C個通道,它們就總共有 3 ( 3 2 C 2 = 27 C 2 3(3^2C^2=27C^2 3(32C2=27C2個參數,而一個7x7就會有 7 2 C 2 = 49 C 2 7^2C^2=49C^2 72C2=49C2,接近少了81%。
VGG的網絡結構具體如下所示:

四、 Conclusion
經典網絡結構VGG。