天天看點

目标檢測入門系列手冊五:YOLO訓練教程

>>戳此處立即下載下傳電子書<< ,學習全套目标檢測算法&模型

目标檢測入門系列手冊五:YOLO訓練教程

YOLO

由于在R-CNN 的系列算法中都需要首先擷取大量proposal,但proposal 之間有很大的重疊,會帶來很多重複的工作。YOLO[5] 一改基于proposal 的預測思路,将輸入圖檔劃分成SxS 個小格子,在每個小格子中做預測,最終将結果合并,如圖2-14 所示。接下來我們看一下YOLO 學習的關鍵步驟:

(1)YOLO 對于網絡輸入圖檔的尺寸有要求,首先需要将圖檔縮放到指定尺寸(448x448),再将圖檔劃分成SxS 的小格。

(2)每個小格裡面做這幾個預測:該小格是否包含物體、包含物體對應的矩形框位置以及該小格對應C 個類别的分數是多少。是以,每個小格需要預測的的次元為B x(1+4)+ C,其中B 代表每個小格最多可能交疊物體的個數,1 為該小格是否包含物體的置信度,4 用來預測矩形框,C 表示任務中所有可能的類别個數(不包含背景)。是以,YOLO 網絡最終特征層的大小為 S x S x( Bx5 + C),圖 2-14 中特征

層大小即為 7 x 7 x ( 2 x 5 + 20)=7x7x30(Pascal VOC2012 目标檢測資料集共有20 種類别)。

由于YOLO 直接将輸入圖檔劃分為SxS 個小格,不需要産生proposal 的過程,是以速度比Faster R-CNN 快很多,但是因為粒度較粗,是以精度相比Faster R-CNN 略遜一籌。YOLO 的主要貢獻是為目标檢測提供了另一種思路,并使實時目标檢測成為可能。近幾年,YOLOv2 和YOLOv3 接連推出,感興趣的讀者可以參考附錄的6。

目标檢測入門系列手冊五:YOLO訓練教程

圖2-14 基于Pascal VOC2012 目标檢測資料集的YOLO 示意圖

目标檢測入門系列手冊五:YOLO訓練教程

繼續閱讀