天天看點

目标檢測基礎知識(1)--目标檢測任務描述目标檢測基礎知識(1)–目标檢測任務描述0.參考部落格1.目标檢測項目結構2.目标檢測算法分類3.目标檢測的任務4.目标定位的簡單實作思路5.分類與目标檢測的差別

目标檢測基礎知識(1)–目标檢測任務描述

    本文是目标檢測基礎知識相關的第1次學習記錄,主要包括目标檢測的任務描述,目标檢測的常用算法。

目錄

  • 目标檢測基礎知識(1)--目标檢測任務描述
  • 0.參考部落格
  • 1.目标檢測項目結構
  • 2.目标檢測算法分類
  • 3.目标檢測的任務
  • 4.目标定位的簡單實作思路
  • 5.分類與目标檢測的差別

0.參考部落格

  1. 幹貨 | 目标檢測入門,看這篇就夠了(已更完)
  2. 【目标檢測系列】經典論文回顧
  3. 深度學習檢測小目标常用方法

1.目标檢測項目結構

    在目标檢測工程中,主要的項目結構包括三層,分别是資料采集層、深度模型層、使用者層,這三個層次的相關功能分别為:

  1. 資料采集層:資料收集、标注資料;
  2. 深度模型層:YOLO、SSD模型、模型導出、Serving部署;
  3. 使用者層:前端互動、(Web背景)對接部署的模型。

2.目标檢測算法分類

    目前常用的目标檢測算法分成兩大類:2-stage和1-stage。

  1. 兩步走(2-stage)的目标檢測:

    (1) 先找出候選的一些區域;

    (2) 對候選區進行調整、分類;

    (3) 代表算法:R-CNN、SPP-net、Fast R-CNN、Faster R-CNN;

  2. 端到端(1-stage)的目标檢測:

    (1)采用一個網絡,一步到位;

    (2)輸入待檢測圖檔,輸出有哪些物體,以及物體在什麼位置;

    (3)代表算法:YOLO、SSD;

    目标檢測不僅僅是分類這樣簡單的從一個圖檔輸出一個結果,而且還需要輸出圖檔中目标的具體位置資訊。

3.目标檢測的任務

    目标檢測的具體任務:

  1. 類别:N個類别
  2. 輸入:圖檔
  3. 輸出:物體的類别、物體的位置坐标
  4. 主要評估名額:IOU

    通過目标檢測算法最終得出來的物體位置資訊(x,y,w,h)有一個專業的名詞,叫做 bounding box(bbox) 。兩種類型的bounding box需要進行區分,分别如下:

  1. ground-truth bounding box(GT):圖檔中真實的目标位置(真實結果);
  2. Predicted bounding box:預測的标記框。

    物體位置的表示一般有兩種方式:

  • (x,y,w,h):其中x、y表示物體的中心點的位置,w、h表示中心點舉例物體兩邊的長和寬。
  • (xmin,ymin,xmax,ymax):表示物體的左上角和右下角的位置,其中xmin,ymin表示左上角的位置,xmax,ymax表示右下角的位置。

4.目标定位的簡單實作思路

    增加一段全連接配接層網絡輸出目标的4個位置,并進行相應的損失計算。FC1用于類别的輸出,FC2用于這個物體具體位置數值的輸出。假設有10個類别,輸出的機率值分别為:[p1,p2,…p10],然後輸出這一個對象的四個位置資訊[x,y,w,h],同時也要知道網絡需要輸出什麼内容,并且如何來衡量網絡的損失值:

  • 對于分類的機率,使用交叉熵損失;
  • 對于位置資訊的具體數值,可以使用MSE均方誤差損失(L2損失)。
    目标檢測基礎知識(1)--目标檢測任務描述目标檢測基礎知識(1)–目标檢測任務描述0.參考部落格1.目标檢測項目結構2.目标檢測算法分類3.目标檢測的任務4.目标定位的簡單實作思路5.分類與目标檢測的差別

5.分類與目标檢測的差別

    分類與定位:圖檔中隻有一個物體需要檢測;

    目标檢測:圖檔中有多個物體需要檢測。

繼續閱讀