前言

总结一下特殊层的Tensorflow 实现方式。说不定以后用得着。

一、Squeeze_excitation_layer(SE)

操作方法如下图所示：

神经网络中特殊的网络层前言一、Squeeze_excitation_layer(SE)

上图看起来有点复杂，我直接从国内论文里摘了一张图，这样比较直观。

神经网络中特殊的网络层前言一、Squeeze_excitation_layer(SE)

r 是压缩比，相当于对用到进行一个权重占比，我们来看一下TensorFlow的实现方式。

def squeeze_excitation_layer(x, outdim, ratio):
    '''
    SE module performs inter-channel weighting.
    '''
    squeeze = GlobalAveragePooling2D()(x)

    excitation = Dense(outdim//ratio)(squeeze)
    excitation = Activation('selu')(excitation)
    excitation = Dense(outdim)(excitation)
    excitation = Activation('sigmoid')(excitation)

    excitation = Reshape((1, 1, outdim))(excitation)

    scale = multiply([x, excitation])

    return scale

x 是输入的tensor out_dim 为输出维度，ratio 为压缩比。

对于很难分类的数据集Fer2013来说，使用它能达到70% 左右的准确率，对于那片论文使用的网络结构我复现了一下。

完整网络结构代码：

from keras.models import Model
from keras.layers import Input
from keras.layers import Lambda
from keras.layers import Reshape

from keras.layers import Conv2D
from keras.layers import Activation
from keras.layers import AveragePooling2D
from keras.layers import GlobalAveragePooling2D
from keras.layers import BatchNormalization
from keras.layers import Dense

from keras.layers import Concatenate, concatenate
from keras.layers import Add, add
from keras.layers import Multiply, multiply

from keras import backend as K
from numpy import pad
from tensorflow.python.keras.layers.advanced_activations import Softmax
from tensorflow.python.keras.layers.convolutional import DepthwiseConv2D
from tensorflow.python.keras.layers.pooling import MaxPooling2D


def squeeze_excitation_layer(x, outdim, ratio):
    '''
    SE module performs inter-channel weighting.
    '''
    squeeze = GlobalAveragePooling2D()(x)

    excitation = Dense(outdim//ratio)(squeeze)
    excitation = Activation('selu')(excitation)
    excitation = Dense(outdim)(excitation)
    excitation = Activation('sigmoid')(excitation)

    excitation = Reshape((1, 1, outdim))(excitation)

    scale = multiply([x, excitation])

    return scale


def conv_se_layer(x, filters, se_ratio):
    out = Conv2D(filters=filters, kernel_size=3)(x)
    out = squeeze_excitation_layer(out, filters, se_ratio)
    return out


def separable_se_layer(x, filters, se_ratio,is_pooling=False):
    out = DepthwiseConv2D(kernel_size=3,strides=1,padding='same',use_bias=False)(x)
    out = BatchNormalization()(out)
    out = Activation('selu')(out)
    out = Conv2D(filters=filters,kernel_size=1,strides=1,padding='same',use_bias=False)(out)
    out = squeeze_excitation_layer(out, filters, se_ratio)
    if is_pooling:
        out = MaxPooling2D(3,2,padding='same')(out)
    return out

def built_model(input_shape=(48,48,1)):
    input_img = Input(shape=input_shape)
    x = conv_se_layer(input_img,filters=32,se_ratio=2)
    x = conv_se_layer(x,filters=64,se_ratio=4)

    x = separable_se_layer(x,128,se_ratio=8)
    x = separable_se_layer(x,128,se_ratio=8,is_pooling=True)

    x = separable_se_layer(x,256,se_ratio=16)
    x = separable_se_layer(x,256,se_ratio=16,is_pooling=True)

    x = separable_se_layer(x,728,se_ratio=16)
    x = separable_se_layer(x,728,se_ratio=16,is_pooling=True)

    x = separable_se_layer(x,1024,se_ratio=32)
    x = separable_se_layer(x,1024,se_ratio=32,is_pooling=True)

    x = Conv2D(filters=7,kernel_size=3,strides=1)(x)
    x = GlobalAveragePooling2D()(x)
    x = Softmax()(x)
    return Model(input_img,x) 

if __name__ == '__main__':
    x = Input(shape=(22, 22, 256))
    # scale = squeeze_excitation_layer(x,256,2)
    # print(scale.shape)
    x = separable_se_layer(x, 256, 2)
    print(x.shape)
    # x=separable_se_layer(x,256,3,is_pooling=True)
    # print(x.shape)
    model = built_model()
    model.summary()

可以用Fer2013 自己试一试。

神经网络中特殊的网络层前言一、Squeeze_excitation_layer(SE)

文章目录

前言

一、Squeeze_excitation_layer(SE)

继续阅读

2021年银行从业考试考情介绍,果断收藏!

证券从业合格证书什么时候打印？有哪些注意事项？

【干货满满】初级银行从业考试《个人理财》重点梳理

2020年经济师考试，难吗？

初级银行从业资格证有什么用？

MBA提前面试纯干货分享

MBA值得学么

通俗理解查准率(precision)和查全率(recall)

吴恩达logistic回归实现

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

深度学习模型分析人类复杂疾病的准确性

人工智能如何有效地运用于自然语言处理

【趋高机器视觉】机器视觉技术原理解析及解决方案

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

cs231n斯坦福基于卷积神经网络的CV学习笔记（一）KNN和线性分类器/分类器损失/反向传播一，KNN图像分类算法二，线性分类器三，线性分类器损失四，反向传播五，神经网络