首先看一下網絡架構:
非常簡單的一個訓練檔案,一個測試檔案,一個模型檔案。
模型結構圖:
亮點(2012):
缺點:
1.model.py
對照表:
self.features = nn.Sequential() :精簡子產品代碼,提高複用。放入conv層代碼或者全連接配接層代碼。
第一層:Conv1-》 nn.Conv2d(3, 48, kernel_size=11, stride=4, padding=2),
卷積核大小=11,卷積核個數=48,RGB圖像:3通道,步長=4,圖像上下,左右各加兩層0.
輸入:3,通道224x224
輸出:48層, 55x 55。
然後結果一次Relu函數的激活。
第二層:最大池化Maxpool1-》 nn.MaxPool2d(kernel_size=3, stride=2),
卷積核大小=11,步長=2
輸出: 48層 27x27
第三層:Conv2-》 nn.Conv2d(48, 128, kernel_size=5, padding=2),
卷積核大小=5,卷積核個數=128,RGB圖像:48通道,步長=1,圖像上下,左右各加兩層0.
輸入: 48層 27x27
輸出:128層 27,x27,大小沒變
然後結果一次Relu函數的激活。
第四層:最大池化Maxpool2-》 nn.MaxPool2d(kernel_size=3, stride=2),
卷積核大小=3,步長=2
輸出: 48層 13x13
第五層:Conv3-》 nn.Conv2d(128, 192, kernel_size=3, padding=1),
卷積核大小=3,卷積核個數=192,RGB圖像:128通道,步長=1,圖像上下,左右各加兩層0.
輸出:192層 13,x13,大小沒變
然後結果一次Relu函數的激活。
第六層:Conv4-》nn.Conv2d(192, 192, kernel_size=3, padding=1),
卷積核大小=3,卷積核個數=192,RGB圖像:192通道,步長=1,圖像上下,左右各加一層0.
輸出:192層 13,x13,大小沒變
然後結果一次Relu函數的激活。
第七層:Conv5-》nn.Conv2d(192, 128, kernel_size=3, padding=1),
卷積核大小=3,卷積核個數=128,RGB圖像:192通道,步長=1,圖像上下,左右各加一層0.
輸出:128層 13x13,大小沒變
然後結果一次Relu函數的激活。
第八層:最大池化Maxpool3-》 nn.MaxPool2d(kernel_size=3, stride=2),
卷積核大小=3,步長=2
輸出: 48層 6x6
下面就是分類層classifier:
Dropout層:nn.Dropout(p=0.5)-》随機損失一半權重參數
全連接配接層:nn.Linear(128 * 6 * 6, 2048),-》輸入128通道的6*6圖像,連接配接層節點個數為2048個
ReL激活層: nn.ReLU(inplace=True),-》減少計算 量,防止梯度消失。
Dropout層:nn.Dropout(p=0.5)-》随機損失一半權重參數
全連接配接層:nn.Linear(2048, 2048),,-》輸入2048個參數,連接配接層節點個數為2048個
ReL激活層: nn.ReLU(inplace=True),-》減少計算 量,防止梯度消失。
全連接配接層:nn.Linear(2048, num_classes),,,-》輸入2048個參數,連接配接層節點個數為分類個數
最後是權重初始化:
def _initialize_weights(self):
for m in self.modules():
if isinstance(m, nn.Conv2d):
nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
if m.bias is not None:
nn.init.constant_(m.bias, 0)
elif isinstance(m, nn.Linear):
nn.init.normal_(m.weight, 0, 0.01)
nn.init.constant_(m.bias, 0)
如果調用model.py時傳入init_weights參數為TRUE。模型調用此方法初始化卷積層核全連接配接層參數為0,就是從頭開始訓練,一般不用這個函數。
前向傳播函數:def forward(self, x):
調用卷積模型:x = self.features(x)
将卷積層得到的參數轉成一維向量:x = torch.flatten(x, start_dim=1)
傳入全連接配接層:x = self.classifier(x)
最後附上完整代碼:
import torch.nn as nn
import torch
class AlexNet(nn.Module):
def __init__(self, num_classes=1000, init_weights=False):
super(AlexNet, self).__init__()
self.features = nn.Sequential(
nn.Conv2d(3, 48, kernel_size=11, stride=4, padding=2), # input[3, 224, 224] output[48, 55, 55]
nn.ReLU(inplace=True),
nn.MaxPool2d(kernel_size=3, stride=2), # output[48, 27, 27]
nn.Conv2d(48, 128, kernel_size=5, padding=2), # output[128, 27, 27]
nn.ReLU(inplace=True),
nn.MaxPool2d(kernel_size=3, stride=2), # output[128, 13, 13]
nn.Conv2d(128, 192, kernel_size=3, padding=1), # output[192, 13, 13]
nn.ReLU(inplace=True),
nn.Conv2d(192, 192, kernel_size=3, padding=1), # output[192, 13, 13]
nn.ReLU(inplace=True),
nn.Conv2d(192, 128, kernel_size=3, padding=1), # output[128, 13, 13]
nn.ReLU(inplace=True),
nn.MaxPool2d(kernel_size=3, stride=2), # output[128, 6, 6]
)
self.classifier = nn.Sequential(
nn.Dropout(p=0.5),
nn.Linear(128 * 6 * 6, 2048),
nn.ReLU(inplace=True),
nn.Dropout(p=0.5),
nn.Linear(2048, 2048),
nn.ReLU(inplace=True),
nn.Linear(2048, num_classes),
)
if init_weights:
self._initialize_weights()
def forward(self, x):
x = self.features(x)
x = torch.flatten(x, start_dim=1)
x = self.classifier(x)
return x
def _initialize_weights(self):
for m in self.modules():
if isinstance(m, nn.Conv2d):
nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
if m.bias is not None:
nn.init.constant_(m.bias, 0)
elif isinstance(m, nn.Linear):
nn.init.normal_(m.weight, 0, 0.01)
nn.init.constant_(m.bias, 0)
GitHub連結:https://github.com/WZMIAOMIAO/deep-learning-for-image-processing