天天看點

目标檢測入門系列手冊一:定位 + 分類問題的解法

>>戳此處立即下載下傳電子書<< ,學習全套目标檢測算法&模型

https://yq.aliyun.com/download/3818?spm=a2c6h.12873639.0.0.5c3b5c0709ax0n
目标檢測入門系列手冊一:定位 + 分類問題的解法
https://yq.aliyun.com/download/3818?spm=a2c6h.12873639.0.0.5c3b5c0709ax0n

定位 + 分類問題是分類到目标檢測的一個過渡問題,從單純地圖檔分類到分類後給出目标所處位置,再到多目标的類别和位置。接下來,我們看一下定位+ 分類問題的解法。

目标檢測入門系列手冊一:定位 + 分類問題的解法

分類不用多說,上一章我們以分類為例講了卷積神經網絡。在定位問題中,則需要模型傳回目标所在的外接矩形框,即目标的(x,y,w,h)四元組。

接下來介紹一種比較容易想到的思路,把定位當做回歸問題,具體步驟如下:

(1)訓練(或下載下傳)一個分類模型,例如AlexNet、VGGNet 或ResNet;

(2)在分類網絡最後一個卷積層的特征層(feature map)上添加“regression head”,如圖1-2 所示;補充說明:神經網絡中不同的“head”通常用來訓練不同的目标,每個“head”的損失函數和優化方向不同。如果想讓一個網絡實作多個功能,通常是在神經網絡後面接多個不同功能的“head”。

(3)同時訓練“classification head”和“regression head”,為了同時訓練分類和定位(定位是回歸問題)兩個問題,最終損失函數是分類和定位兩個“head”産生損失的權重和。

(4)在預測時同時使用分類和回歸head 得到分類+ 定位結果。這裡強調一下,分類預測出的結果就是C 個類别,回歸預測的結果可能有兩種:一種是類别無關,輸出4個值;一種是類别相關,輸出4*C 個值,這要看讀者想要哪種結果了。

目标檢測入門系列手冊一:定位 + 分類問題的解法
目标檢測入門系列手冊一:定位 + 分類問題的解法

繼續閱讀