目錄
與以往rcnn,SPPNet,fast rcnn,faster rcnn的不同
YOLO的特點
YOLO的流程
YOLO的網絡結構圖
YOLO的loss function
YOLO的局限
YOLO的實驗結果
論文全稱:《You Only Look Once: Unified, Real-Time Object Detection》
論文位址:https://arxiv.org/pdf/1506.02640.pdf
之前介紹的rcnn,SPPNet,fast rcnn,faster rcnn都是屬于two stage的物體檢測算法,包括了區域提取和目标檢測。從這一篇開始,是one stage的算法,它是一種end-to-end的算法,在確定精度保持基本不變的前提下可以大大提高檢測的速度。

與以往rcnn,SPPNet,fast rcnn,faster rcnn的不同
- YOLO是一個回歸問題,隻要輸入一張圖檔便可完整得到檢測框和分類的類别,以及屬于該類别的置信度。而rcnn/fast rcnn/faster rcnn将檢測結果分為兩部分求解:物體類别(分類問題),物體位置即bounding box(回歸問題)。
- YOLO把region proposal和classification都內建在一個網絡之中,沒有一個顯式的region proposal的過程。是以YOLO可以直接從檢測性能上進行端到端優化。而rcnn SPPNet fast rcnn是屬于兩個子產品的組合(使用selective search挑選候選框),faster rcnn是利用RPN(region proposal network)代替了selective search,但是要不斷來回訓練RPN和分類的網絡,因為他們共享卷積參數
YOLO的特點
- 統一架構使得檢測速度非常快,能夠達到實時的要求。在 Titan X 的 GPU 上 能夠達到 45 幀每秒。YOLO的一個小版本Fast YOLO處理了速度達到驚人的155幀每秒,同時仍然達到了其他實時探測器mAP的兩倍。
- YOLO産生更多的定位錯誤,背景錯誤(把背景錯認為物體)比較少。
- 泛化能力強。YOLO學習了對象的一般表示。在将自然圖像推廣到其他領域(如藝術品)時,它優于其他檢測方法,包括DPM和R-CNN。
- YOLO v1在精确度上仍落後于最先進的檢測系統。雖然它可以快速識别圖像中的對象,但它很難精确定位某些對象,尤其是小對象。
YOLO的流程
- 對輸入的圖像resize
- 卷積神經網絡提取特征
- 根據置信度使用非最大值抑制取出部分候選框
YOLO将一張image分成S*S個格子,。每一個格子預測B個bounding boxes的位置坐标,以及他們的置信度和分類的機率。
這些置信度得分反映了模型對框中包含對象的信心程度,以及它認為框所預測的準确性。下面就是置信度的公式:
如果格中不存在對象,那麼confidence應該為零。否則,我們希望confidence等于預測框和ground truth之間的交集(IOU)。
每個邊界框由5個預測組成:x、y、w、h和confidence。(x, y)坐标表示框的中心相對于網格單元的邊界。寬度和高度是相對于整個圖像進行預測的。最後,confidence預測表示預測框與任何ground truth之間的IOU。
每個格還預測C條件類的機率,
。每個格有一組類機率,不管bounding boxes的數量是多少。
在測試時,将條件類的機率和單個bounding box的置信度預測相乘,
這樣不僅反映每個bounding box是否含有object,還反映了object屬于那種類别的機率。
YOLO的網絡結構圖
YOLO的loss function
損失函數的設計目标就是讓坐标(x,y,w,h),confidence,classification 這個三個方面達到很好的平衡。
YOLO的局限
- YOLO對邊界框預測施加了強烈的空間限制,因為每個網格單元格隻能預測兩個框,并且隻能有一個類。這種空間限制限制了模型能夠預測相鄰對象的數量。模型在處理以群體形式出現的小物體時遇到了困難,比如成群的鳥。
- 由于YOLO是從資料中學會預測邊界框,是以它很難推廣到新的或不常見的縱橫比或配置對象。模型還使用了相對粗糙的特性來預測邊框,因為YOLO的架構有多個從輸入圖像向下采樣的層(卷積層)。
- 損失函數對待小bounding boxes和大bounding boxes中的錯誤是一樣的。大bounding box裡的小錯誤通常是良性的,但小bounding box裡的小錯誤對IOU的影響要大得多。
YOLO的實驗結果
參考:
https://zhuanlan.zhihu.com/p/24916786?utm_source=qq&utm_medium=social
https://zhuanlan.zhihu.com/p/25236464