目錄索引
- 寫在前面
- 問題
- 圖示推導過程
寫在前面
在研究論文的時候,看到了一張圖像經過感受野提取特征後,得到的輸出特征圖大小與步長
Stride
之間的關系,當時有點不太懂,後來自己畫圖實作了一下特征提取的過程,便一目了然了,正如華羅庚先生所講的,“數無形時少直覺,形少數時難入微”。
問題
“輸入一張800*800的圖檔,圖檔經過主幹網絡提取特征後,特征圖縮放步長(stride)為32,是以,圖像的邊長是輸入時的1/32”。
圖示推導過程
看到剛才這個問題的時候,腦海中産生了很多問号,為什麼步長是32,輸出特征圖大小就是原圖的1/32呢?帶着這個疑問,自己動手畫了特征提取的過程圖,如下圖所示:
如圖所示,對于一張
9 * 9
的原始圖像,使用
3 * 3
的感受野提取特征,步長分别設定為
2
或
3
,最後提取得到的特征圖大小分别為
4 * 4
和
3 * 3
,也即
9/2 * 9/2
和
9/3 * 9/3
。是以可見對于一張輸入圖像,感受野提取得到的特征圖大小與步長
Stride
之間是有密切關系的。