目标檢測基礎知識(1)–目标檢測任務描述
本文是目标檢測基礎知識相關的第1次學習記錄,主要包括目标檢測的任務描述,目标檢測的常用算法。
目錄
- 目标檢測基礎知識(1)--目标檢測任務描述
- 0.參考部落格
- 1.目标檢測項目結構
- 2.目标檢測算法分類
- 3.目标檢測的任務
- 4.目标定位的簡單實作思路
- 5.分類與目标檢測的差別
0.參考部落格
- 幹貨 | 目标檢測入門,看這篇就夠了(已更完)
- 【目标檢測系列】經典論文回顧
- 深度學習檢測小目标常用方法
1.目标檢測項目結構
在目标檢測工程中,主要的項目結構包括三層,分别是資料采集層、深度模型層、使用者層,這三個層次的相關功能分别為:
- 資料采集層:資料收集、标注資料;
- 深度模型層:YOLO、SSD模型、模型導出、Serving部署;
- 使用者層:前端互動、(Web背景)對接部署的模型。
2.目标檢測算法分類
目前常用的目标檢測算法分成兩大類:2-stage和1-stage。
-
兩步走(2-stage)的目标檢測:
(1) 先找出候選的一些區域;
(2) 對候選區進行調整、分類;
(3) 代表算法:R-CNN、SPP-net、Fast R-CNN、Faster R-CNN;
-
端到端(1-stage)的目标檢測:
(1)采用一個網絡,一步到位;
(2)輸入待檢測圖檔,輸出有哪些物體,以及物體在什麼位置;
(3)代表算法:YOLO、SSD;
目标檢測不僅僅是分類這樣簡單的從一個圖檔輸出一個結果,而且還需要輸出圖檔中目标的具體位置資訊。
3.目标檢測的任務
目标檢測的具體任務:
- 類别:N個類别
- 輸入:圖檔
- 輸出:物體的類别、物體的位置坐标
- 主要評估名額:IOU
通過目标檢測算法最終得出來的物體位置資訊(x,y,w,h)有一個專業的名詞,叫做 bounding box(bbox) 。兩種類型的bounding box需要進行區分,分别如下:
- ground-truth bounding box(GT):圖檔中真實的目标位置(真實結果);
- Predicted bounding box:預測的标記框。
物體位置的表示一般有兩種方式:
- (x,y,w,h):其中x、y表示物體的中心點的位置,w、h表示中心點舉例物體兩邊的長和寬。
- (xmin,ymin,xmax,ymax):表示物體的左上角和右下角的位置,其中xmin,ymin表示左上角的位置,xmax,ymax表示右下角的位置。
4.目标定位的簡單實作思路
增加一段全連接配接層網絡輸出目标的4個位置,并進行相應的損失計算。FC1用于類别的輸出,FC2用于這個物體具體位置數值的輸出。假設有10個類别,輸出的機率值分别為:[p1,p2,…p10],然後輸出這一個對象的四個位置資訊[x,y,w,h],同時也要知道網絡需要輸出什麼内容,并且如何來衡量網絡的損失值:
- 對于分類的機率,使用交叉熵損失;
- 對于位置資訊的具體數值,可以使用MSE均方誤差損失(L2損失)。
目标檢測基礎知識(1)--目标檢測任務描述目标檢測基礎知識(1)–目标檢測任務描述0.參考部落格1.目标檢測項目結構2.目标檢測算法分類3.目标檢測的任務4.目标定位的簡單實作思路5.分類與目标檢測的差別
5.分類與目标檢測的差別
分類與定位:圖檔中隻有一個物體需要檢測;
目标檢測:圖檔中有多個物體需要檢測。