數字圖像處理：AlexNet代碼（pytorch）之model.py解讀

首先看一下網絡架構：

非常簡單的一個訓練檔案，一個測試檔案，一個模型檔案。

模型結構圖：

數字圖像處理：AlexNet代碼（pytorch）之model.py解讀

亮點（2012）：

數字圖像處理：AlexNet代碼（pytorch）之model.py解讀

缺點：

數字圖像處理：AlexNet代碼（pytorch）之model.py解讀

1.model.py

數字圖像處理：AlexNet代碼（pytorch）之model.py解讀

對照表：

數字圖像處理：AlexNet代碼（pytorch）之model.py解讀

self.features = nn.Sequential() ：精簡子產品代碼，提高複用。放入conv層代碼或者全連接配接層代碼。

第一層：Conv1-》 nn.Conv2d(3, 48, kernel_size=11, stride=4, padding=2),

卷積核大小=11，卷積核個數=48，RGB圖像：3通道，步長=4，圖像上下，左右各加兩層0.

輸入：3,通道224x224

輸出：48層, 55x 55。

然後結果一次Relu函數的激活。

第二層：最大池化Maxpool1-》 nn.MaxPool2d(kernel_size=3, stride=2),

卷積核大小=11，步長=2

輸出: 48層 27x27

第三層：Conv2-》 nn.Conv2d(48, 128, kernel_size=5, padding=2),

卷積核大小=5，卷積核個數=128，RGB圖像：48通道，步長=1，圖像上下，左右各加兩層0.

輸入： 48層 27x27

輸出：128層 27,x27，大小沒變

然後結果一次Relu函數的激活。

第四層：最大池化Maxpool2-》 nn.MaxPool2d(kernel_size=3, stride=2),

卷積核大小=3，步長=2

輸出: 48層 13x13

第五層：Conv3-》 nn.Conv2d(128, 192, kernel_size=3, padding=1),

卷積核大小=3，卷積核個數=192，RGB圖像：128通道，步長=1，圖像上下，左右各加兩層0.

輸出：192層 13,x13，大小沒變

然後結果一次Relu函數的激活。

第六層：Conv4-》nn.Conv2d(192, 192, kernel_size=3, padding=1),

卷積核大小=3，卷積核個數=192，RGB圖像：192通道，步長=1，圖像上下，左右各加一層0.

輸出：192層 13,x13，大小沒變

然後結果一次Relu函數的激活。

第七層：Conv5-》nn.Conv2d(192, 128, kernel_size=3, padding=1),

卷積核大小=3，卷積核個數=128，RGB圖像：192通道，步長=1，圖像上下，左右各加一層0.

輸出：128層 13x13，大小沒變

然後結果一次Relu函數的激活。

第八層：最大池化Maxpool3-》 nn.MaxPool2d(kernel_size=3, stride=2),

卷積核大小=3，步長=2

輸出: 48層 6x6

數字圖像處理：AlexNet代碼（pytorch）之model.py解讀

下面就是分類層classifier：

Dropout層：nn.Dropout(p=0.5)-》随機損失一半權重參數

全連接配接層：nn.Linear(128 * 6 * 6, 2048),-》輸入128通道的6*6圖像，連接配接層節點個數為2048個

ReL激活層： nn.ReLU(inplace=True),-》減少計算量，防止梯度消失。

Dropout層：nn.Dropout(p=0.5)-》随機損失一半權重參數

全連接配接層：nn.Linear(2048, 2048),,-》輸入2048個參數，連接配接層節點個數為2048個

ReL激活層： nn.ReLU(inplace=True),-》減少計算量，防止梯度消失。

全連接配接層：nn.Linear(2048, num_classes),,,-》輸入2048個參數，連接配接層節點個數為分類個數

最後是權重初始化：

def _initialize_weights(self):

for m in self.modules():

if isinstance(m, nn.Conv2d):

nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')

if m.bias is not None:

nn.init.constant_(m.bias, 0)

elif isinstance(m, nn.Linear):

nn.init.normal_(m.weight, 0, 0.01)

nn.init.constant_(m.bias, 0)

如果調用model.py時傳入init_weights參數為TRUE。模型調用此方法初始化卷積層核全連接配接層參數為0，就是從頭開始訓練，一般不用這個函數。

前向傳播函數：def forward(self, x):

調用卷積模型：x = self.features(x)

将卷積層得到的參數轉成一維向量：x = torch.flatten(x, start_dim=1)

傳入全連接配接層：x = self.classifier(x)

最後附上完整代碼：

import torch.nn as nn
import torch


class AlexNet(nn.Module):
    def __init__(self, num_classes=1000, init_weights=False):
        super(AlexNet, self).__init__()
        self.features = nn.Sequential(
            nn.Conv2d(3, 48, kernel_size=11, stride=4, padding=2),  # input[3, 224, 224]  output[48, 55, 55]
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),                  # output[48, 27, 27]
            nn.Conv2d(48, 128, kernel_size=5, padding=2),           # output[128, 27, 27]
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),                  # output[128, 13, 13]
            nn.Conv2d(128, 192, kernel_size=3, padding=1),          # output[192, 13, 13]
            nn.ReLU(inplace=True),
            nn.Conv2d(192, 192, kernel_size=3, padding=1),          # output[192, 13, 13]
            nn.ReLU(inplace=True),
            nn.Conv2d(192, 128, kernel_size=3, padding=1),          # output[128, 13, 13]
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),                  # output[128, 6, 6]
        )
        self.classifier = nn.Sequential(
            nn.Dropout(p=0.5),
            nn.Linear(128 * 6 * 6, 2048),
            nn.ReLU(inplace=True),
            nn.Dropout(p=0.5),
            nn.Linear(2048, 2048),
            nn.ReLU(inplace=True),
            nn.Linear(2048, num_classes),
        )
        if init_weights:
            self._initialize_weights()

    def forward(self, x):
        x = self.features(x)
        x = torch.flatten(x, start_dim=1)
        x = self.classifier(x)
        return x

    def _initialize_weights(self):
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
                if m.bias is not None:
                    nn.init.constant_(m.bias, 0)
            elif isinstance(m, nn.Linear):
                nn.init.normal_(m.weight, 0, 0.01)
                nn.init.constant_(m.bias, 0)

GitHub連結：https://github.com/WZMIAOMIAO/deep-learning-for-image-processing

數字圖像處理：AlexNet代碼（pytorch）之model.py解讀

繼續閱讀

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普