論文要點
- 多尺度檢測網絡,各分支隻關心自己負責的尺度範圍;
- 網絡設計以部署平台運作效率為目标,使用優化效果最高的結構設計網絡;
- Anchor類方法有離散、樣本不均、依靠經驗等問題,提出使用RF的Anchor-Free方法。
主要内容
基于Anchors的方法存在問題
- Anchor很難充分覆寫所有尺寸的人臉;
- IOU門檻值需要靠經驗選取;
- Anchor數量與尺寸全靠經驗,容易導緻樣本不平衡和備援計算。
RF 和 ERF
Feature map中每一個點都對應一個感受野(RF),處于感受野越靠近中心位置的像素對結構影響越大;越小的人臉越需要更多的上下文資訊,有效感受野(ERF)也就需要覆寫更多的context information(大的人臉能直接判别,但小的人臉需要借助脖子、肩膀等上下文資訊來判斷);感受野可以複用為Anchor。
模型結構
模型結構主幹網絡使用目前主流部署工具優化性能最高的3x3卷積核,通過降維分割為tiny、small、medium、large四個部分,分别取2、2、1、3共8路檢測分支,每個分支通過1x1卷積核從主幹網絡中導出。由于測試BN層會減慢約17%,是以網絡中不包含BN層。
根據網上大家的解讀,RF的計算公式為:
R F i = R F i − 1 + ( k − 1 ) ∗ s t r i d e RF_i=RF_{i-1}+(k-1)*stride RFi=RFi−1+(k−1)∗stride
以下為根據這個公式的計算結果,不一定正确。由于訓練的圖像最大為640x640子圖,是以RF的最大尺寸達到639。
55 = 35 + ( 6 − 1 ) ∗ 4 55=35+(6-1)*4 55=35+(6−1)∗4
71 = 55 + ( 5 − 1 ) ∗ 4 71=55+(5-1)*4 71=55+(5−1)∗4
111 = 71 + ( 6 − 1 ) ∗ 8 111=71+(6-1)*8 111=71+(6−1)∗8
143 = 111 + ( 5 − 1 ) ∗ 8 143=111+(5-1)*8 143=111+(5−1)∗8
223 = 143 + ( 6 − 1 ) ∗ 16 223=143+(6-1)*16 223=143+(6−1)∗16
383 = 223 + ( 6 − 1 ) ∗ 32 383=223+(6-1)*32 383=223+(6−1)∗32
511 = 383 + ( 5 − 1 ) ∗ 32 511=383+(5-1)*32 511=383+(5−1)∗32
639 = 511 + ( 5 − 1 ) ∗ 32 639=511+(5-1)*32 639=511+(5−1)∗32
損失函數
損失函數包含分類交叉熵、回歸L2,其中分類損失計算時設定各分支隻檢測自己尺度範圍内的人臉,主要為對下邊界0.9-1、上邊界1-1.1系數範圍内設定gray scales,剩下的劃分為positive/negative。
資料預處理
WIDER FACE資料集中的12880張圖像,150000張驗證集人臉,丢棄少于10x10像素的人臉(網絡設計中能檢測到的最小人臉為10x10)。輸入圖像先減127.5,再除以127.5.
資料增廣方法包括:
- Color Distort 增加光噪聲、更改亮度對比度等;
- Random Sampling 随機選擇一個圖像、一個人臉,選擇某個區間内大小的人臉進行整體縮放,并以選擇的人臉為中心截取一個640*640的子圖,将超出的區域填充黑色。同時通過随機采樣,保證不同分支輸出人臉數相同、人臉被各分支采樣的機率相同。
- Randomly Horizontal Flip 以0.5的機率對子圖進行随機翻轉。
訓練過程中,根據損失值對負樣本排序,以正負樣本1:10的比例選取排名靠前的負樣本。
訓練參數
參數 | 設定值 |
---|---|
初始化方法 | Xavier |
Optimization | Sgd |
Momentum | 0.9 |
Weight decay | |
Batchsize | 32 |
Lr | 0.1 |
Iteration | 1500000 |
衰減政策 | 600000/1000000/1200000/1400000 |
評估方法
SIO【Single Inference on the Original】以原圖輸入運作一次,而不進行多尺度變化 ,對SSH這種有trick的影響較大。
多平台測試,TITAN Xp、TX2、RaspberryPi3。
參數量與推理耗時的關系對比: E n e t = F L O P s / t E_{net}=FLOPs/t Enet=FLOPs/t
參考連結
論文位址
人臉識别論文閱讀筆記1 – CVPR2019-LFFD
LFFD A Light and Fast Face Detector for Edge Devices論文閱讀筆記
[論文了解] LFFD: A Light and Fast Face Detector for Edge Devices