天天看點

盤點熱門的目标檢測開源方案(附論文+代碼下載下傳)

盤點熱門的目标檢測開源方案(附論文+代碼下載下傳)

在2020年中,目标檢測領域出現了許多優秀的工作,今天我們來聊一聊在目前熱門的五大目标檢測開源方案。

1、五大改進,二十多項技巧實驗,堪稱最強目标檢測萬花筒:YOLOv4&YOLOv5

論文:YOLOv4: Optimal Speed and Accuracy of Object Detection

COCO AP:55.4

論文位址:​​https://arxiv.org/pdf/2004.10934.pdf​​

代碼位址:​​https://github.com/AlexeyAB/darknet​​

YOLOv5:​​https://github.com/ultralytics/yolov5​​

(非官方)源碼位址:

  (1) Pytorch版:​​https://github.com/WongKinYiu/PyTorch_YOLOv4​​

  (2) tensorflow版:​​https://github.com/ultralytics/yolov5​​

YOLOv4試驗對比了大量的近幾年來最新的深度學習技巧,例如  Swish、Mish激活函數,CutOut和CutMix資料增強方法,DropPath和DropBlock正則化方法,也提出了自己的創新,例如 Mosaic (馬賽克) 和 自對抗訓練資料增強方法,提出了修改版本的 SAM 和 PAN,跨Batch的批歸一化(BN),共五大改進。是以說該文章工作非常紮實,也極具創新。

YOLOv5的工作與YOLOv4十分相近,YOLOv4的網絡結構圖:

盤點熱門的目标檢測開源方案(附論文+代碼下載下傳)

2、基于Transformer的目标檢測新範式: DETR

論文:End-to-End Object Detection with Transformers

論文位址:​​https://arxiv.org/abs/2006.02334​​

代碼位址:​​https://github.com/facebookresearch/detr​​

DETR将檢測視為集合預測問題,簡化了目标檢測的整體流程。它沒有現在主流的目标檢測器中的anchor、label assign、nms等操作,做到了真正的end-to-end。它主要采用了Transformer的編解碼結構,它在序列預測任務上大獲成功。Transformer中的自注意力機制顯示地界定了序列中元素間的互相作用,是以可以用于限制集合的預測結果。

DETR的檢測思路是首先使用CNN提取圖像特征,然後用transformer模型來檢測物體輸出set of box predictions ,訓練過程采用二分圖比對損失函數。

盤點熱門的目标檢測開源方案(附論文+代碼下載下傳)

3、目前最高最快最小模型,可擴縮且高效的目标檢測: EfficientDet

論文:EfficientDet: Scalable and Efficient Object Detection

論文位址:​​https://arxiv.org/abs/2005.12872​​

代碼位址:​​https://github.com/google/automl​​

COCO AP: 51.0 

(非官方)源碼位址:

  (1) Pytorch版:​​https://github.com/toandaominh1997/EfficientDet.Pytorch​​

  (2) Keras&&TensorFlow版:​​https://github.com/xuannianz/EfficientDet​​

EfficientDet一大創新點是改進了FPN中的多尺度特征融合方式,提出了權重雙向特征金字塔網絡BiFPN。BiFPN 引入了一種自頂向下的路徑,融合P3~P7的多尺度特征, 并且EfficientDet認為FPN中各尺度的特征重要性是不同的,故在BiFPN特征融合的連接配接中需要權重,而權值是在訓練中學習得到的。EfficientDet引入了 EfficientNet 中模型縮放的思想,考慮Input size、backbone Network、BiFPN側向級聯層數、Box/class 層深度作為搜尋空間,通過統一的系數縮放(具體方法見原論文),得到了8個不同計算量和參數量的模型。

盤點熱門的目标檢測開源方案(附論文+代碼下載下傳)

參考閱讀:EfficientDet 算法解讀

​​https://zhuanlan.zhihu.com/p/93241232​​

4、CenterNet2以56.4mAP超越目前所有檢測模型

論文:Probabilistic two-stage detection

論文位址:​​https://arxiv.org/abs/2103.07461​​

代碼位址:​​https://github.com/xingyizhou/CenterNet2​​

COCO AP:  56.4

CenterNet2在目前最先進的One-Stage檢測器的基礎上建立了一個機率Two-Stage檢測器。對于每一階段的檢測,CenterNet2模型都會提取區域級特征并進行分類。在第2階段使用更快的R-CNN或級聯分類器。這兩個階段一起訓練,以最大限度地提高預測的機率準确度。在推理中,CenterNet2使用這個最終的對數似然作為檢測得分。

結構說明:

盤點熱門的目标檢測開源方案(附論文+代碼下載下傳)

參考閱讀:​​Centernet 算法解讀​​

5、特征金字塔與空洞卷積完美結合的目标檢測:DetectoRS

論文:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution

論文位址:​​https://arxiv.org/abs/2005.12872​​

代碼位址:​​https://github.com/joe-siyuan-qiao/DetectoRS​​

COCO AP: 54.7 AP

DetectoRS是谷歌團隊提出的目标檢測模型,論文中探讨了目标檢測中looking and thinking twice的機制,在宏觀上提出了遞歸特征金字塔RFN(Recursive Feature Pyramid),就是把FPN的輸出先連接配接到bottom up那兒進行再次輸入,然後再輸出時候與原FPN的輸出再進行結合一起輸出。在微觀上提出了可切換空洞卷積SAC(Switchable Atrous Convolution)。在COCO test-dev中取得了SOTA的結果,目标檢測box mAP達到54.7,執行個體分割mask mAP達到47.1,全景分割PQ達到49.6。

盤點熱門的目标檢測開源方案(附論文+代碼下載下傳)

參考閱讀:​​DetectoRS算法解讀​​

本文僅做學術分享,如有侵權,請聯系删文。

上一篇: p2psim 首頁
下一篇: p2psim 學習

繼續閱讀