在2020年中,目标檢測領域出現了許多優秀的工作,今天我們來聊一聊在目前熱門的五大目标檢測開源方案。
1、五大改進,二十多項技巧實驗,堪稱最強目标檢測萬花筒:YOLOv4&YOLOv5
論文:YOLOv4: Optimal Speed and Accuracy of Object Detection
COCO AP:55.4
論文位址:https://arxiv.org/pdf/2004.10934.pdf
代碼位址:https://github.com/AlexeyAB/darknet
YOLOv5:https://github.com/ultralytics/yolov5
(非官方)源碼位址:
(1) Pytorch版:https://github.com/WongKinYiu/PyTorch_YOLOv4
(2) tensorflow版:https://github.com/ultralytics/yolov5
YOLOv4試驗對比了大量的近幾年來最新的深度學習技巧,例如 Swish、Mish激活函數,CutOut和CutMix資料增強方法,DropPath和DropBlock正則化方法,也提出了自己的創新,例如 Mosaic (馬賽克) 和 自對抗訓練資料增強方法,提出了修改版本的 SAM 和 PAN,跨Batch的批歸一化(BN),共五大改進。是以說該文章工作非常紮實,也極具創新。
YOLOv5的工作與YOLOv4十分相近,YOLOv4的網絡結構圖:
2、基于Transformer的目标檢測新範式: DETR
論文:End-to-End Object Detection with Transformers
論文位址:https://arxiv.org/abs/2006.02334
代碼位址:https://github.com/facebookresearch/detr
DETR将檢測視為集合預測問題,簡化了目标檢測的整體流程。它沒有現在主流的目标檢測器中的anchor、label assign、nms等操作,做到了真正的end-to-end。它主要采用了Transformer的編解碼結構,它在序列預測任務上大獲成功。Transformer中的自注意力機制顯示地界定了序列中元素間的互相作用,是以可以用于限制集合的預測結果。
DETR的檢測思路是首先使用CNN提取圖像特征,然後用transformer模型來檢測物體輸出set of box predictions ,訓練過程采用二分圖比對損失函數。
3、目前最高最快最小模型,可擴縮且高效的目标檢測: EfficientDet
論文:EfficientDet: Scalable and Efficient Object Detection
論文位址:https://arxiv.org/abs/2005.12872
代碼位址:https://github.com/google/automl
COCO AP: 51.0
(非官方)源碼位址:
(1) Pytorch版:https://github.com/toandaominh1997/EfficientDet.Pytorch
(2) Keras&&TensorFlow版:https://github.com/xuannianz/EfficientDet
EfficientDet一大創新點是改進了FPN中的多尺度特征融合方式,提出了權重雙向特征金字塔網絡BiFPN。BiFPN 引入了一種自頂向下的路徑,融合P3~P7的多尺度特征, 并且EfficientDet認為FPN中各尺度的特征重要性是不同的,故在BiFPN特征融合的連接配接中需要權重,而權值是在訓練中學習得到的。EfficientDet引入了 EfficientNet 中模型縮放的思想,考慮Input size、backbone Network、BiFPN側向級聯層數、Box/class 層深度作為搜尋空間,通過統一的系數縮放(具體方法見原論文),得到了8個不同計算量和參數量的模型。
參考閱讀:EfficientDet 算法解讀
https://zhuanlan.zhihu.com/p/93241232
4、CenterNet2以56.4mAP超越目前所有檢測模型
論文:Probabilistic two-stage detection
論文位址:https://arxiv.org/abs/2103.07461
代碼位址:https://github.com/xingyizhou/CenterNet2
COCO AP: 56.4
CenterNet2在目前最先進的One-Stage檢測器的基礎上建立了一個機率Two-Stage檢測器。對于每一階段的檢測,CenterNet2模型都會提取區域級特征并進行分類。在第2階段使用更快的R-CNN或級聯分類器。這兩個階段一起訓練,以最大限度地提高預測的機率準确度。在推理中,CenterNet2使用這個最終的對數似然作為檢測得分。
結構說明:
參考閱讀:Centernet 算法解讀
5、特征金字塔與空洞卷積完美結合的目标檢測:DetectoRS
論文:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution
論文位址:https://arxiv.org/abs/2005.12872
代碼位址:https://github.com/joe-siyuan-qiao/DetectoRS
COCO AP: 54.7 AP
DetectoRS是谷歌團隊提出的目标檢測模型,論文中探讨了目标檢測中looking and thinking twice的機制,在宏觀上提出了遞歸特征金字塔RFN(Recursive Feature Pyramid),就是把FPN的輸出先連接配接到bottom up那兒進行再次輸入,然後再輸出時候與原FPN的輸出再進行結合一起輸出。在微觀上提出了可切換空洞卷積SAC(Switchable Atrous Convolution)。在COCO test-dev中取得了SOTA的結果,目标檢測box mAP達到54.7,執行個體分割mask mAP達到47.1,全景分割PQ達到49.6。
參考閱讀:DetectoRS算法解讀
本文僅做學術分享,如有侵權,請聯系删文。