天天看点

MobileNet-V1一. 简介二. 模型结构三. 总结

写目录

  • 一. 简介
  • 二. 模型结构
    • 2.1 正常卷积操作
    • 2.2 深度可分离卷积
  • 三. 总结

一. 简介

论文地址:mobilenet-v1

二. 模型结构

mobilenet提出了一种叫做Depthwise separable convolution的卷积结构,翻译过来即 深度可分离卷积。那跟平时的卷积有什么区别呢。首先看下原来正常的卷积结构。

2.1 正常卷积操作

假设现在有:

  • input channel: N
  • output channel: M
  • kernel size: k

那么正常的参数量为:N* M* k* k。

简单的示意图如下所示:

(这里假设N=3, M=2)

MobileNet-V1一. 简介二. 模型结构三. 总结

2.2 深度可分离卷积

  • step1,对于每个通道的输入,只用单个卷积核对它进行处理,这一步参数量为:k* k* N。(此时,参数的计算暂时与output channel无关),这个阶段叫做depthwise convolutions。
  • step2,正常卷积操作,只不过卷积核大小为1x1,这一步是为了把第一步分离计算的结果合并,这一步的参数量为:N* M。这个阶段叫做pointwise convolutions。
  • 总的参数量为:k* k* N + N* M。
  • 与正常卷积相比:(k* k* N + N* M)/ N* M* k* k = 1/M + 1/k^2。参数量少了很多

整个示意图如下图所示:

(input channel=3, output channel=2)

MobileNet-V1一. 简介二. 模型结构三. 总结

三. 总结

MobileNet的优点是可以大大减少模型的参数,可以部署在移动端。如论文中的图所示:

MobileNet-V1一. 简介二. 模型结构三. 总结

结束。

继续阅读