天天看點

《ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices》

核心思想:

本論文的核心關注點在于卷積神經網絡中的1x1卷積子產品,作者指出在XCeption和ResNetXt等網絡模型中,雖然采用了深度可分離卷積來降低參數量和計算量,但是這樣又引入了大量的1x1标準卷積操作,導緻的結果就是網絡模型中存在大量的1x1卷積操作,1x1卷積的參數量和計算量占據了絕對的大頭。下圖是MobileNetV1網絡使用深度可分離卷積之後的參數量和計算量統計,1x1卷積無論在參數量和計算量上都占據絕對大頭:

《ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices》

核心方法:

是以本論文将1x1卷積作為重點關照對象,在深度可分離卷積中采用分組卷積的方式大大降低了卷積操作的參數量和計算量,是以作者将1x1卷積也修改為分組的1x1卷積,分組卷積的特點是各個channel單獨進行卷積計算,沒有融合多個channel的特征,即使堆疊多個分組卷積操作也無法提取到通道channel次元的融合特征。為了克服分組卷積帶來的通道特征融合問題,論文中又提出對channel次元進行shuffle來實作通道次元特征融合的目的,這樣使得後一層的卷積的輸入中包含前一層輸出的所有通道特征。這樣就可以通過連續使用分組卷積來降低模型的參數量和計算量,同時還能保證提取到更具代表性的特征。

《ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices》

ShuffleNet核心單元:1x1分組卷積和channel shuffle

《ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices》

ShuffleNet網絡結構:

《ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices》

存在的問題: 

分組卷積雖然顯著降低了模型的參數量和計算量,但是帶來了更多的顯存通路次數,導緻模型雖然有較少的參數量和計算量,但是推理時間(inference time)确并不一定少。這一點在X3D視訊動作識别模型上也有所展現。

《ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices》

繼續閱讀