天天看點

論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

論文要點

  • 多尺度檢測網絡,各分支隻關心自己負責的尺度範圍;
  • 網絡設計以部署平台運作效率為目标,使用優化效果最高的結構設計網絡;
  • Anchor類方法有離散、樣本不均、依靠經驗等問題,提出使用RF的Anchor-Free方法。

主要内容

基于Anchors的方法存在問題

  1. Anchor很難充分覆寫所有尺寸的人臉;
  2. IOU門檻值需要靠經驗選取;
  3. Anchor數量與尺寸全靠經驗,容易導緻樣本不平衡和備援計算。
    論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

RF 和 ERF

  Feature map中每一個點都對應一個感受野(RF),處于感受野越靠近中心位置的像素對結構影響越大;越小的人臉越需要更多的上下文資訊,有效感受野(ERF)也就需要覆寫更多的context information(大的人臉能直接判别,但小的人臉需要借助脖子、肩膀等上下文資訊來判斷);感受野可以複用為Anchor。

論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

模型結構

  模型結構主幹網絡使用目前主流部署工具優化性能最高的3x3卷積核,通過降維分割為tiny、small、medium、large四個部分,分别取2、2、1、3共8路檢測分支,每個分支通過1x1卷積核從主幹網絡中導出。由于測試BN層會減慢約17%,是以網絡中不包含BN層。

論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

  根據網上大家的解讀,RF的計算公式為:

R F i = R F i − 1 + ( k − 1 ) ∗ s t r i d e RF_i=RF_{i-1}+(k-1)*stride RFi​=RFi−1​+(k−1)∗stride

  以下為根據這個公式的計算結果,不一定正确。由于訓練的圖像最大為640x640子圖,是以RF的最大尺寸達到639。

   55 = 35 + ( 6 − 1 ) ∗ 4 55=35+(6-1)*4 55=35+(6−1)∗4

   71 = 55 + ( 5 − 1 ) ∗ 4 71=55+(5-1)*4 71=55+(5−1)∗4

   111 = 71 + ( 6 − 1 ) ∗ 8 111=71+(6-1)*8 111=71+(6−1)∗8

   143 = 111 + ( 5 − 1 ) ∗ 8 143=111+(5-1)*8 143=111+(5−1)∗8

   223 = 143 + ( 6 − 1 ) ∗ 16 223=143+(6-1)*16 223=143+(6−1)∗16

   383 = 223 + ( 6 − 1 ) ∗ 32 383=223+(6-1)*32 383=223+(6−1)∗32

   511 = 383 + ( 5 − 1 ) ∗ 32 511=383+(5-1)*32 511=383+(5−1)∗32

   639 = 511 + ( 5 − 1 ) ∗ 32 639=511+(5-1)*32 639=511+(5−1)∗32

論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

損失函數

  損失函數包含分類交叉熵、回歸L2,其中分類損失計算時設定各分支隻檢測自己尺度範圍内的人臉,主要為對下邊界0.9-1、上邊界1-1.1系數範圍内設定gray scales,剩下的劃分為positive/negative。

論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

資料預處理

  WIDER FACE資料集中的12880張圖像,150000張驗證集人臉,丢棄少于10x10像素的人臉(網絡設計中能檢測到的最小人臉為10x10)。輸入圖像先減127.5,再除以127.5.

  資料增廣方法包括:

  • Color Distort 增加光噪聲、更改亮度對比度等;
  • Random Sampling 随機選擇一個圖像、一個人臉,選擇某個區間内大小的人臉進行整體縮放,并以選擇的人臉為中心截取一個640*640的子圖,将超出的區域填充黑色。同時通過随機采樣,保證不同分支輸出人臉數相同、人臉被各分支采樣的機率相同。
  • Randomly Horizontal Flip 以0.5的機率對子圖進行随機翻轉。

  訓練過程中,根據損失值對負樣本排序,以正負樣本1:10的比例選取排名靠前的負樣本。

訓練參數

參數 設定值
初始化方法 Xavier
Optimization Sgd
Momentum 0.9
Weight decay
Batchsize 32
Lr 0.1
Iteration 1500000
衰減政策 600000/1000000/1200000/1400000

評估方法

  SIO【Single Inference on the Original】以原圖輸入運作一次,而不進行多尺度變化 ,對SSH這種有trick的影響較大。

  多平台測試,TITAN Xp、TX2、RaspberryPi3。

  參數量與推理耗時的關系對比: E n e t = F L O P s / t E_{net}=FLOPs/t Enet​=FLOPs/t

參考連結

  論文位址

  人臉識别論文閱讀筆記1 – CVPR2019-LFFD

  LFFD A Light and Fast Face Detector for Edge Devices論文閱讀筆記

  [論文了解] LFFD: A Light and Fast Face Detector for Edge Devices

  

  

  

繼續閱讀