學習《TensorFlow實戰Google深度學習架構》（十）Inception-v3模型

6.4.2 Inception-v3模型

Inception-v3結構是一種和LeNet-5結構完全不同的卷積神經網絡結構。在LeNet-5模型中，不同卷積層通過串聯的方式連接配接在一起，而Inception-v模型中的Inception結構是将不同的卷積層通過并聯的方式結合在一起。

Inception提出同時使用所有不同尺寸的卷積核，然後再将得到的矩陣拼接起來。

如圖所示

學習《TensorFlow實戰Google深度學習架構》（十）Inception-v3模型

Inceptiong子產品會首先使用不同尺寸的卷積核處理輸入矩陣。

圖中，最上方的矩陣為使用了邊長為1的卷積核的卷積層前向傳播結果。

不同的矩陣代表了Inception子產品中的一條計算路徑。

雖然卷積核尺寸不同，但如果每次卷積都使用全0填充且步長為1，那麼前向傳播得到的結果矩陣的長和寬都與輸入矩陣一緻。

這樣經過不同卷積核處理的結果矩陣可以拼接成一個更深的矩陣。

參考論文Rethinking the Inception Architecture for Computer Vision

下圖給出了Inception-v3的模型架構圖

學習《TensorFlow實戰Google深度學習架構》（十）Inception-v3模型

Inception-v3模型總共有46層，由11個Inception子產品組成。圖中方框标注出來的結構就是一個Inception子產品。在Inception-V3模型中有96個卷積層，如果将6.4.1的程式直接搬過來，那麼一個卷積層就需要5行代碼，于是總共需要480行代碼來實作所有的卷積層，這樣使得代碼的可讀性非常差。為了更好的實作類似Inception-v3模型這樣的複雜卷積神經網絡，在下面将先介紹TensorFlow-Slim工具來更加簡潔地實作一個卷積層。以下代碼對比了直接使用TensorFlow實作一個卷積層和使用TensorFlow-Slim實作同樣結構的神經網絡的代碼量。

# 直接使用TensorFlow原始API實作卷積層
with tf.variable_scope(scope_name):
	weights = tf.get_variable("weight",...)
	biases = tf.get_variable("bias",...)
	conv = tf.nn.conv2d(...)
	relu = tf.nn.relu(tf.nn.bias_add(conv,biases))

# 使用TensorFlow-Slim實作卷積層。slim.conv2d有三個參數是必填的。第一個參數為輸入節點矩陣，第二個參數是目前卷積核的個數，第三個參數是卷積核的尺寸。可選的參數有軍機和移動的步長，是否使用全0填充，激活函數的選擇以及變量的命名空間等。
net = slim.conv2d(input, 32, [3, 3])

TensorFlow-Slim是對TensorFlow原生API的二次封裝

以下代碼實作了上圖方框中的Inception子產品

# 加載slim庫
slim = tf.contrib.slim

# slim.arg_scope函數可以用于設定預設的參數取值。slim_arg_scope函數的第一個參數是一個函數清單，
# 在這個清單中的函數将使用預設的參數取值。比如通過下面的定義，調用slim.conv2d(net, 320, [1, 1])
# 函數時會自動加上stride=1和padding='SAME'的參數。通過這種方式可以進一步減少備援代碼
with slim.arg_scope([slim.conv2d, slim.max_poole2d, slim.avg_pool2d],
                    strides=1, padding='VALID'):
    # 此處省略了Inception-V3模型其他的網絡結構而直接實作最後的Inception結構。結社輸入圖檔經過之
    # 前的神經網絡前向傳播結果儲存在變量net中。
    net = 上一層輸出節點矩陣
    # 為一個Inception子產品聲明一個統一的變量命名空間
    with tf.variable_scope('Mixed_7c'):
        # 給Inception子產品中每一條路徑聲明一個命名空間
        with tf.variable_scope('Branch_0'):
            # 實作一個有320個邊長為1的卷積核的卷積層
            branch_0 = slim.conv2d(net, 320, [1, 1], scope='Conv2d_0a_1x1')

        # Inception子產品中第二條路徑。這條計算路徑上的結構本身也是一個Inception結構
        with tf.variable_scope('Branch_1'):
            branch_1 = slim.conv2d(net, 384, [1, 1],scope='Conv2d_0a_1x1')
            # tf.concat函數可以将多個矩陣拼接起來。tf.concat函數的第一個參數指定了拼接的次元，這裡給出的“3”
            # 代表了矩陣是在這個深度這個次元上進行拼接。圖1展示了在深度上拼接矩陣的方式。
            branch_1 = tf.concat(3, [
                # 如圖2所示，此處2層卷積層的輸入都是branch_1而不是net
                slim.conv2d(branch_1, 384, [1, 3], scope='Conv2d_0b_1x3'),
                slim.conv2d(branch_1, 384, [3, 1], scope='Conv2d_0c_3x1')
            ])
        # Inception子產品中第三條路徑。此計算路徑也是一個Inception結構
        with tf.variable_scope('Branch_2'):
            branch_2 = slim.conv2d(net, 448, [1, 1], scope='Conv2d_0a_1x1')
            branch_2 = slim.conv2d(branch_2, 384, [3, 3], scope='Conv2d_0b_3x3')
            branch_2 = tf.concat(3, [
                slim.conv2d(branch_2, 384, [1, 3], scope='Conv2d_0c_1x3'),
                slim.conv2d(branch_2, 384, [3, 1], scope='Conv2d_0c_3x1')
            ])
            
        # Inception子產品中第四條路徑。
        with tf.variable_scope('Branch_3'):
            branch_3 = slim.avg_pool2d(net, [3, 3], scope='AvgPool_0a_3x3')
            branch_3 = slim.conv2d(branch_3, 192, [1, 1], scope='Conv2d_0b_1x1')
            
        # 目前Inception子產品的最後輸出是由上面4個計算結果拼接得到的
        net = tf.concat(3, [branch_0, branch_1, branch_2, branch_3])

學習《TensorFlow實戰Google深度學習架構》（十）Inception-v3模型

6.4.2 Inception-v3模型

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

考證大全 | 證券從業資格考試

敲黑闆！2021年證券從業考試考點預測

2021年銀行從業考試考情介紹,果斷收藏!

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

【趨高機器視覺】機器視覺技術原了解析及解決方案

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡