論文要點

多尺度檢測網絡，各分支隻關心自己負責的尺度範圍；
網絡設計以部署平台運作效率為目标，使用優化效果最高的結構設計網絡；
Anchor類方法有離散、樣本不均、依靠經驗等問題，提出使用RF的Anchor-Free方法。

主要内容

基于Anchors的方法存在問題

Anchor很難充分覆寫所有尺寸的人臉；
IOU門檻值需要靠經驗選取；
Anchor數量與尺寸全靠經驗，容易導緻樣本不平衡和備援計算。

論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

RF 和 ERF

Feature map中每一個點都對應一個感受野（RF），處于感受野越靠近中心位置的像素對結構影響越大；越小的人臉越需要更多的上下文資訊，有效感受野（ERF）也就需要覆寫更多的context information(大的人臉能直接判别，但小的人臉需要借助脖子、肩膀等上下文資訊來判斷)；感受野可以複用為Anchor。

論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

模型結構

模型結構主幹網絡使用目前主流部署工具優化性能最高的3x3卷積核，通過降維分割為tiny、small、medium、large四個部分，分别取2、2、1、3共8路檢測分支，每個分支通過1x1卷積核從主幹網絡中導出。由于測試BN層會減慢約17%，是以網絡中不包含BN層。

論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

根據網上大家的解讀，RF的計算公式為：

R F i = R F i − 1 + ( k − 1 ) ∗ s t r i d e RF_i=RF_{i-1}+(k-1)*stride RFi=RFi−1+(k−1)∗stride

以下為根據這個公式的計算結果，不一定正确。由于訓練的圖像最大為640x640子圖，是以RF的最大尺寸達到639。

55 = 35 + （ 6 − 1 ） ∗ 4 55=35+（6-1）*4 55=35+（6−1）∗4

71 = 55 + （ 5 − 1 ） ∗ 4 71=55+（5-1）*4 71=55+（5−1）∗4

111 = 71 + （ 6 − 1 ） ∗ 8 111=71+（6-1）*8 111=71+（6−1）∗8

143 = 111 + （ 5 − 1 ） ∗ 8 143=111+（5-1）*8 143=111+（5−1）∗8

223 = 143 + （ 6 − 1 ） ∗ 16 223=143+（6-1）*16 223=143+（6−1）∗16

383 = 223 + （ 6 − 1 ） ∗ 32 383=223+（6-1）*32 383=223+（6−1）∗32

511 = 383 + （ 5 − 1 ） ∗ 32 511=383+（5-1）*32 511=383+（5−1）∗32

639 = 511 + （ 5 − 1 ） ∗ 32 639=511+（5-1）*32 639=511+（5−1）∗32

論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

損失函數

損失函數包含分類交叉熵、回歸L2，其中分類損失計算時設定各分支隻檢測自己尺度範圍内的人臉，主要為對下邊界0.9-1、上邊界1-1.1系數範圍内設定gray scales，剩下的劃分為positive/negative。

論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

資料預處理

WIDER FACE資料集中的12880張圖像，150000張驗證集人臉，丢棄少于10x10像素的人臉（網絡設計中能檢測到的最小人臉為10x10）。輸入圖像先減127.5，再除以127.5.

資料增廣方法包括：

Color Distort 增加光噪聲、更改亮度對比度等；
Random Sampling 随機選擇一個圖像、一個人臉，選擇某個區間内大小的人臉進行整體縮放，并以選擇的人臉為中心截取一個640*640的子圖，将超出的區域填充黑色。同時通過随機采樣，保證不同分支輸出人臉數相同、人臉被各分支采樣的機率相同。
Randomly Horizontal Flip 以0.5的機率對子圖進行随機翻轉。

訓練過程中，根據損失值對負樣本排序，以正負樣本1:10的比例選取排名靠前的負樣本。

訓練參數

參數	設定值
初始化方法	Xavier
Optimization	Sgd
Momentum	0.9
Weight decay
Batchsize	32
Lr	0.1
Iteration	1500000
衰減政策	600000/1000000/1200000/1400000

評估方法

SIO【Single Inference on the Original】以原圖輸入運作一次，而不進行多尺度變化，對SSH這種有trick的影響較大。

多平台測試，TITAN Xp、TX2、RaspberryPi3。

參數量與推理耗時的關系對比： E n e t = F L O P s / t E_{net}=FLOPs/t Enet=FLOPs/t

參考連結

論文位址

人臉識别論文閱讀筆記1 – CVPR2019-LFFD

LFFD A Light and Fast Face Detector for Edge Devices論文閱讀筆記

[論文了解] LFFD: A Light and Fast Face Detector for Edge Devices

論文學習 LFFD: A Light and Fast Face Detector for Edge Devices論文要點主要内容

論文要點

主要内容

基于Anchors的方法存在問題

RF 和 ERF

模型結構

損失函數

資料預處理

訓練參數

評估方法

參考連結

繼續閱讀

考證大全 | 證券從業資格考試

敲黑闆！2021年證券從業考試考點預測

2021年銀行從業考試考情介紹,果斷收藏!

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

PLDA簡介

【趨高機器視覺】機器視覺技術原了解析及解決方案

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡