论文要点

多尺度检测网络，各分支只关心自己负责的尺度范围；
网络设计以部署平台运行效率为目标，使用优化效果最高的结构设计网络；
Anchor类方法有离散、样本不均、依靠经验等问题，提出使用RF的Anchor-Free方法。

主要内容

基于Anchors的方法存在问题

Anchor很难充分覆盖所有尺寸的人脸；
IOU阈值需要靠经验选取；
Anchor数量与尺寸全靠经验，容易导致样本不平衡和冗余计算。

论文学习 LFFD: A Light and Fast Face Detector for Edge Devices论文要点主要内容

RF 和 ERF

Feature map中每一个点都对应一个感受野（RF），处于感受野越靠近中心位置的像素对结构影响越大；越小的人脸越需要更多的上下文信息，有效感受野（ERF）也就需要覆盖更多的context information(大的人脸能直接判别，但小的人脸需要借助脖子、肩膀等上下文信息来判断)；感受野可以复用为Anchor。

论文学习 LFFD: A Light and Fast Face Detector for Edge Devices论文要点主要内容

模型结构

模型结构主干网络使用当前主流部署工具优化性能最高的3x3卷积核，通过降维分割为tiny、small、medium、large四个部分，分别取2、2、1、3共8路检测分支，每个分支通过1x1卷积核从主干网络中导出。由于测试BN层会减慢约17%，因此网络中不包含BN层。

论文学习 LFFD: A Light and Fast Face Detector for Edge Devices论文要点主要内容

根据网上大家的解读，RF的计算公式为：

R F i = R F i − 1 + ( k − 1 ) ∗ s t r i d e RF_i=RF_{i-1}+(k-1)*stride RFi=RFi−1+(k−1)∗stride

以下为根据这个公式的计算结果，不一定正确。由于训练的图像最大为640x640子图，所以RF的最大尺寸达到639。

55 = 35 + （ 6 − 1 ） ∗ 4 55=35+（6-1）*4 55=35+（6−1）∗4

71 = 55 + （ 5 − 1 ） ∗ 4 71=55+（5-1）*4 71=55+（5−1）∗4

111 = 71 + （ 6 − 1 ） ∗ 8 111=71+（6-1）*8 111=71+（6−1）∗8

143 = 111 + （ 5 − 1 ） ∗ 8 143=111+（5-1）*8 143=111+（5−1）∗8

223 = 143 + （ 6 − 1 ） ∗ 16 223=143+（6-1）*16 223=143+（6−1）∗16

383 = 223 + （ 6 − 1 ） ∗ 32 383=223+（6-1）*32 383=223+（6−1）∗32

511 = 383 + （ 5 − 1 ） ∗ 32 511=383+（5-1）*32 511=383+（5−1）∗32

639 = 511 + （ 5 − 1 ） ∗ 32 639=511+（5-1）*32 639=511+（5−1）∗32

论文学习 LFFD: A Light and Fast Face Detector for Edge Devices论文要点主要内容

损失函数

损失函数包含分类交叉熵、回归L2，其中分类损失计算时设定各分支只检测自己尺度范围内的人脸，主要为对下边界0.9-1、上边界1-1.1系数范围内设定gray scales，剩下的划分为positive/negative。

论文学习 LFFD: A Light and Fast Face Detector for Edge Devices论文要点主要内容

数据预处理

WIDER FACE数据集中的12880张图像，150000张验证集人脸，丢弃少于10x10像素的人脸（网络设计中能检测到的最小人脸为10x10）。输入图像先减127.5，再除以127.5.

数据增广方法包括：

Color Distort 增加光噪声、更改亮度对比度等；
Random Sampling 随机选择一个图像、一个人脸，选择某个区间内大小的人脸进行整体缩放，并以选择的人脸为中心截取一个640*640的子图，将超出的区域填充黑色。同时通过随机采样，保证不同分支输出人脸数相同、人脸被各分支采样的概率相同。
Randomly Horizontal Flip 以0.5的概率对子图进行随机翻转。

训练过程中，根据损失值对负样本排序，以正负样本1:10的比例选取排名靠前的负样本。

训练参数

参数	设定值
初始化方法	Xavier
Optimization	Sgd
Momentum	0.9
Weight decay
Batchsize	32
Lr	0.1
Iteration	1500000
衰减策略	600000/1000000/1200000/1400000

评估方法

SIO【Single Inference on the Original】以原图输入运行一次，而不进行多尺度变化，对SSH这种有trick的影响较大。

多平台测试，TITAN Xp、TX2、RaspberryPi3。

参数量与推理耗时的关系对比： E n e t = F L O P s / t E_{net}=FLOPs/t Enet=FLOPs/t

参考链接

论文地址

人脸识别论文阅读笔记1 – CVPR2019-LFFD

LFFD A Light and Fast Face Detector for Edge Devices论文阅读笔记

[论文理解] LFFD: A Light and Fast Face Detector for Edge Devices

论文学习 LFFD: A Light and Fast Face Detector for Edge Devices论文要点主要内容

论文要点

主要内容

基于Anchors的方法存在问题

RF 和 ERF

模型结构

损失函数

数据预处理

训练参数

评估方法

参考链接

继续阅读

考证大全 | 证券从业资格考试

敲黑板！2021年证券从业考试考点预测

2021年银行从业考试考情介绍,果断收藏!

证券从业合格证书什么时候打印？有哪些注意事项？

【干货满满】初级银行从业考试《个人理财》重点梳理

2020年经济师考试，难吗？

初级银行从业资格证有什么用？

MBA提前面试纯干货分享

MBA值得学么

吴恩达logistic回归实现

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

深度学习模型分析人类复杂疾病的准确性

PLDA简介

【趋高机器视觉】机器视觉技术原理解析及解决方案

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

cs231n斯坦福基于卷积神经网络的CV学习笔记（一）KNN和线性分类器/分类器损失/反向传播一，KNN图像分类算法二，线性分类器三，线性分类器损失四，反向传播五，神经网络