Fast R_CNN
Fast R_CNN算法流程可分為3個步驟:
1)一張圖生成1k~2k個候選框(使用Selective Search方法)
2)将圖像輸入網絡得到響應的特征圖,将SS算法生成的候選框投影到特征圖上獲得響應的特征矩陣
3)将每個特征矩陣通過ROI pooling層縮放到7x7大小的特征圖,接着将特征圖展平,通過一系列全連接配接層得到預測結果。注:ROI(Region of Interset)

1、一次性計算整張圖像特征
R_CNN:依次将候選框區域輸入卷積神經網絡得到特征
Fast R_CNN将整張圖像送入網絡,緊接着從特征圖像上提取相應的候選區域。這些候選區域的特征不需要再重複計算。且不再限制輸入圖像的尺寸。
2、資料采樣
訓練過程中并不是選用SS算法提供的所有候選框,隻選用一小部分就可以,對于我們采集的候選框分為正樣本和負樣本,正樣本(論文中IOU>0.5)指候選框中存在我們需要的物體,負樣本指隻有背景沒有目标物體。
3、分類器
輸出N+1個類别的機率(N為檢測目标的種類,1為背景)共N+1個節點。
4、邊界框回歸器
輸出對應N+1個類别的候選邊界框回歸參數(dx,dy,dw,dh),共(N+1)x4個節點。
5、Multi-task loss
其中,
當u>=1時,[u>=1]為1;當u<1時,[u>=1]為0.
6、fast R_CNN架構