写目录
- 一. 简介
- 二. 模型结构
-
- 2.1 正常卷积操作
- 2.2 深度可分离卷积
- 三. 总结
一. 简介
论文地址:mobilenet-v1
二. 模型结构
mobilenet提出了一种叫做Depthwise separable convolution的卷积结构,翻译过来即 深度可分离卷积。那跟平时的卷积有什么区别呢。首先看下原来正常的卷积结构。
2.1 正常卷积操作
假设现在有:
- input channel: N
- output channel: M
- kernel size: k
那么正常的参数量为:N* M* k* k。
简单的示意图如下所示:
(这里假设N=3, M=2)

2.2 深度可分离卷积
- step1,对于每个通道的输入,只用单个卷积核对它进行处理,这一步参数量为:k* k* N。(此时,参数的计算暂时与output channel无关),这个阶段叫做depthwise convolutions。
- step2,正常卷积操作,只不过卷积核大小为1x1,这一步是为了把第一步分离计算的结果合并,这一步的参数量为:N* M。这个阶段叫做pointwise convolutions。
- 总的参数量为:k* k* N + N* M。
- 与正常卷积相比:(k* k* N + N* M)/ N* M* k* k = 1/M + 1/k^2。参数量少了很多
整个示意图如下图所示:
(input channel=3, output channel=2)
三. 总结
MobileNet的优点是可以大大减少模型的参数,可以部署在移动端。如论文中的图所示:
结束。