如何将Mish函數用到深度學習算法中

2021-11-17 23:50:00

摘要

如何在Pytorch使用Mish函數

如何在Keras中使用Mish激活函數。

Diganta Misra的一篇題為“Mish: A Self Regularized Non-Monotonic Neural Activation Function”的新論文介紹了一個新的深度學習激活函數，該函數在最終準确度上比Swish(+.494%)和ReLU(+ 1.671%)都有提高

公式如下：

何在Pytorch使用Mish函數

定義Mish函數。

class Mish(torch.nn.Module):
 
    def __init__(self):
 
        super().__init__()
 
 
 
    def forward(self, x):
 
        x = x * (torch.tanh(torch.nn.functional.softplus(x)))
 
        return x

調用函數：

class Path1_64(nn.Module):
 
    def __init__(self):
 
        super().__init__()
 
        self.conv1 = ConvBN(32, 64, 3)
 
        self.conv2 = ConvBN(64, 64, [1, 9])
 
        self.conv3 = ConvBN(64, 64, [9, 1])
 
        self.conv4 = ConvBN(64, 64, 1)
 
        self.resBlock = ResBlock(ch=64, nblocks=2)
 
        self.conv5 = ConvBN(64, 64, [1, 7])
 
        self.conv6 = ConvBN(64, 64, [7, 1])
 
        self.conv7 = ConvBN(64, 64, 1)
 
        self.relu = Mish()
 
 
 
    def forward(self, input):
 
        x1 = self.conv1(input)
 
        x2 = self.conv2(x1)
 
        x3 = self.conv3(x2)
 
        x4 = self.conv4(x3)
 
        r1 = self.resBlock(x4)
 
        x5 = self.conv5(r1)
 
        x6 = self.conv6(x5)
 
        x7 = self.conv7(x6)
 
        x7 = self.relu(x7 + x4)
 
        return x7

調用Mish激活函數和調用其他的激活函數一樣，直接調用即可。

如何在 Keras 中使用Mish激活函數。

定義Mish激活函數

import tensorflow as tf
from tensorflow.python.keras.layers import *
from tensorflow.keras.layers import Activation
from tensorflow.keras.utils import get_custom_objects
 
 
 
class Mish(Activation):
 
    def __init__(self, activation, **kwargs):
 
        super(Mish, self).__init__(activation, **kwargs)
 
        self.__name__ = 'Mish'
 
def mish(inputs):
 
    return inputs * tf.math.tanh(tf.math.softplus(inputs))
 
get_custom_objects().update({'Mish': Mish(mish)})

調用激活函數：

def bn_prelu(x):

x = BatchNormalization(epsilon=1e-5)(x)

x = Activation('Mish')(x)

return x

def build_model(out_dims, input_shape=(100, 100, 3)):

inputs_dim = Input(input_shape)

x = Conv2D(32, (3, 3), strides=(2, 2), padding='same')(inputs_dim)

x = bn_prelu(x)

x = Conv2D(32, (3, 3), strides=(1, 1), padding='same')(x)

x = MaxPooling2D(pool_size=(2, 2))(x)

x = Conv2D(64, (3, 3), strides=(1, 1), padding='same')(x)

x = Conv2D(128, (3, 3), strides=(1, 1), padding='same')(x)

x = Conv2D(256, (3, 3), strides=(1, 1), padding='same')(x)

x = GlobalAveragePooling2D()(x)

dp_1 = Dropout(0.5)(x)

fc2 = Dense(out_dims)(dp_1)

fc2 = Activation('softmax')(fc2) # 此處注意，為sigmoid函數

model = Model(inputs=inputs_dim, outputs=fc2)

return model

model = build_model(2) # 生成模型

optimizer = Adam(lr=1e-3) # 加入優化器，設定優化器的學習率。

model.compile(optimizer=optimizer, loss='sparse_categorical_crossentropy', metrics=['accuracy'])

如何将Mish函數用到深度學習算法中

繼續閱讀

查找算法之二分查找查找算法之二分查找

查找算法學習之二分查找（Python版本）——BinarySearch

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

C++ 第十五周報告1--《冒泡法排序》

【Torch】最簡潔logging使用指南

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希