VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION
VGG-net
论文链接: https://arxiv.org/abs/1409.1556v6
一、 Problem Statement
作者研究了网络的深度,与精度的关系。发现通过使用3x3卷积增加网络深度可以提升精度。
二、 Direction
增加网络深度。
三、 Method
两个3x3卷积层(在中间没有spatial pooling)堆叠在一起的感知域是5x5,而三个3x3卷积层堆叠在一起的感知域是7x7。所以作者发现,使用一个7x7卷积层和使用三个3x3卷积层堆叠在一起有以下优点:
- 三个卷积层之间可以多插入三个recitification layers,这使得决策函数更具区分性。
-
减少了参数量。
假设三个3x3卷积层有 C C C个通道,它们就总共有 3 ( 3 2 C 2 = 27 C 2 3(3^2C^2=27C^2 3(32C2=27C2个参数,而一个7x7就会有 7 2 C 2 = 49 C 2 7^2C^2=49C^2 72C2=49C2,接近少了81%。
VGG的网络结构具体如下所示:

四、 Conclusion
经典网络结构VGG。