天天看點

SSD: Single Shot MultiBox Detector學習總結

發表會議:2016 ECCV

作者:Wei Liu

論文:https://arxiv.org/abs/1512.02325

代碼:https://github.com/weiliu89/caffe/tree/ssd

一:模型結構

SSD由VGG-16擴充并添加四個卷積層而成。

SSD: Single Shot MultiBox Detector學習總結

                                                                     圖1:網絡結構模型圖

SSD: Single Shot MultiBox Detector學習總結

                                                                        圖2:網絡模型詳細結構圖

二:核心算法

2.1多尺度特征圖

作者同時采用低層和高層的不同尺度的feature map做檢測。 所謂多尺度采用大小不同的特征圖,CNN網絡一般前面的特征圖比較大,後面會逐漸采用stride=2的卷積或者pool來降低特征圖大小。如下圖所示:一個比較大的特征圖和一個比較小的特征圖,它們都用來做檢測。這樣做的好處是比較大的特征圖來用來檢測相對較小的目标,而小的特征圖負責檢測大目标。

SSD: Single Shot MultiBox Detector學習總結

                                                             圖3 :多尺度特征圖

2.2:default box(對特征圖切割)

default box 就是每一個格子上,一系列固定大小的 box,即圖中虛線所形成的一系列 boxes。

SSD: Single Shot MultiBox Detector學習總結

                                                         圖4:多尺度特征圖上産生k個default box

3.3 Default box 生成規則

SSD: Single Shot MultiBox Detector學習總結

3.4 prior box

      prior box是指實際中選擇的default box(每一個feature map cell 中的k個default box選取一部分)。prior box則是實際的選取。訓練中一張完整的圖檔送進網絡獲得各個feature map,将prior box與ground truth box做比對,将prior box盡可能回歸到ground truth box。

SSD: Single Shot MultiBox Detector學習總結

                                                       圖5:通過Prior box後進行NMS選擇final box

3.5 正負樣本

在生成一系列的 predictions boxs之後,會産生很多個符合 ground truth box 的 predictions boxes,但不符合 ground truth boxes 也很多,而且 negative boxes遠多于 positive boxes,會造 negative  boxes、positive boxes 之間的不均衡。訓練時難以收斂。 是以作者采取先将每一個物體位置上對應predictions(default boxes)是 negative 的 boxes 進行排序,按照default boxes的confidence 的大小。選擇最高的幾個,保證最後 negatives、positives 的比例在 3:1。

3.6 損失函數

SSD: Single Shot MultiBox Detector學習總結

四:實驗結果分析總結

SSD: Single Shot MultiBox Detector學習總結
SSD: Single Shot MultiBox Detector學習總結

1)SSD采用CNN直接進行檢測,然而YOLO在全連接配接層之後進行檢測;

2)SSD提取的不同尺度的feature map來做檢測,大尺度的特征圖(靠前的特征圖)用來檢測比較小的物體,而小尺度的特征圖用來檢測大物體;

3)SSD采用了不同尺度和不同長寬比的先驗框(Prior Box ,Default Box,在faster r-cnn中叫做錨,Anchor); SSD算法是在YOLO的基礎上改進的單階段方法,通過融合多個feature map上的BB,在提高速度的同時提高了檢測的精度,性能超過了YOLO和Faster-rcnn。

繼續閱讀