【論文閱讀筆記】SSD：Single Shot MultiBox Detector

2023-05-08 15:03:21

位址：SSD：Single Shot MultiBox Detector

時間：2015年12月釋出，2016年12月最終

全文概括

SSD引入了Faster RCNN的anchor，使用多level 的 feature map來進行分類和回歸，進而增強多尺度的語義資訊(SSD應用在不同尺度的feature 上)。

【論文閱讀筆記】SSD：Single Shot MultiBox Detector

在VOC 2007 test資料集上，SSD達到 74.3 % 74.3\% 74.3%的mAP及 59 59 59FPS；而Faster R-CNN 達到 73.2 % 73.2\% 73.2%的mAP及 7 7 7FPS、YOLO達到 63.4 % 63.4\% 63.4%的mAP及 45 45 45FPS。

即SSD達到了當時最好的性能，且比YOLO要快

(個人認為，在骨架網絡上，SSD與YOLO最大的差別在于沒有後面的fc層，即

速度的提升來自于conv層代替fc層

。fc層需要更大的記憶體，而conv可以通過資料複用，減少通路存儲的次數。而且，conv層的可優化加速空間更大)

在不同level的feature map上，使用的檢測網絡(分類和回歸)是不一樣的，即不共用。

SSD模型

骨幹網絡使用VGG16，但fc6和fc7變成conv layer，移除fc8和dropout層，pool5從22-stride2變成33-stride1；

檢測網絡在每個不同level的feature map是不同的，假設該層feature map有p個channel，使用33p的卷積核得到輸出的一個次元（即預測其中的一個值，類别分數或者邊框offset）；

每個anchor都計算分類分數和邊框偏移；

模型相關訓練方法

模型訓練時，使用硬負樣本縮減政策，正負比例為1:3；

标記樣本時，重疊率超過0.5就标記為ground truth；[作者認為，這簡化了學習問題，允許網絡給多個重疊annchor高分，而不是要求它僅選最大重疊的框]；

損失函數使用和Faster RCNN一樣的：平滑L1損失函數+softmax loss；

【論文閱讀筆記】SSD：Single Shot MultiBox Detector

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

考證大全 | 證券從業資格考試

敲黑闆！2021年證券從業考試考點預測

2021年銀行從業考試考情介紹,果斷收藏!

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

【趨高機器視覺】機器視覺技術原了解析及解決方案

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡