PyTorch ------GoogLeNet卷积神经网络实现mnist手写体识别

计划将所有的经典模型使用pytorch在搞一遍
接上一篇NIN现实mnist手写识别
使用经典模型GoogLeNet模型实现相同的功能
GoogLeNet论文原文地址

GoogLeNet简介

GoogLeNet是2014年提出的一种全新的深度学习结构，在这之前的AlexNet、VGG、NIN等结构都通过增大网络深度（层数）来获得更好的训练效果，但层数的增加会带来很多负作用，比如overfit、梯度消失、梯度爆炸等。inception从另一种角度来提升训练结果：在相同的计算量下能提取到更多的特征，从而提升性能

GoogLeNet 由Inception基础块组成
Inception块相当于一个有4条子线路的小网络,它通过不同的filter卷积层和最大池化层来并行抽取信息,并使用1X1卷积层减少通道数从而降低模型复杂度.
可以自定义的超参数是每个层的输出通道数没我们以此来控制模型的复杂度.
inception 经历了V1、V2、V3、V4 多个版本发展,不断调整完善
inception V1 Block structure:
- PyTorch ------GoogLeNet卷积神经网络实现mnist手写体识别
- 前面也介绍过1X1卷积核的作用:
  - 为了减少维度,消除计算瓶颈
  - 增加深度而不会降低性能
  - 还用于修正线性激活函数,
  - 还可以减少很多的可训练参数

GoogLeNet模型

完整模型结构
PyTorch ------GoogLeNet卷积神经网络实现mnist手写体识别
- GoogLeNet采用了可以重复堆叠使用的Inception Block 该做法,与前面介绍的VGG类似
- GoogLeNet采用GAP代替全连接层,与前面介绍的NIN模块的想法也类似
- 汲取前面模型的优点
GoogLeNet网络结构细节表图:
PyTorch ------GoogLeNet卷积神经网络实现mnist手写体识别
输入原始图片尺寸224X224X3
上表中“#3x3 reduce”，“#5x5 reduce”表示在3x3，5x5卷积操作之前使用了1x1卷积的数量
其他的都可以看懂,就不解释了
下面还是老节目,上代码: import sys import torch import torch.nn as nn import torch.optim as optim import time import torchvision import torchvision.transforms as transforms from torchviz import make_dot import matplotlib.pyplot as plt import torch.nn.functional as F device = torch.device(“cuda” if torch.cuda.is_available() else “cpu”) class GlobalAvgPool2d(nn.Module): #全局平均池化层可通过将池化窗口形状设置成输入的高和宽实现 def init(self): super(GlobalAvgPool2d, self).init() def forward(self, x): return F.avg_pool2d(x, kernel_size=x.size()[2:]) class FlattenLayer(torch.nn.Module): def init(self): super(FlattenLayer, self).init() def forward(self, x): # x shape: (batch, *, *, …) return x.view(x.shape[0], -1) #计算准确率 def evaluate_accuracy(data_iter,net,device = torch.device(“cpu”)): #创建正确率和总个数 acc_sum ,n = torch.tensor([0],dtype=torch.float32,device=device),0 for X,y in data_iter: # 适配设备 X,y = X.to(device),y.to(device) # 设置验证模式 net.eval() with torch.no_grad(): #隔离开不要计算在计算图内 y = y.long()#在这里将y转成long确实是不必要的。但是在计算交叉熵时，Pytorch强制要求y是long acc_sum += torch.sum((torch.argmax(net(X),dim=1) == y)) # 累计预测正确的个数 n += y.shape[0] # 累计总的标签个数 return acc_sum.item() / n #下载数据组装好训练数据测试数据 def load_data_fashion_mnist(batch_size,resize = None,root = “./dataset/input/FashionMNIST2065”): trans = [] if resize: # 做数据增强处理将图片转化为规定大小数据内容不会丢失等比例处理 trans.append(torchvision.transforms.Resize(size=resize)) #将图片类型转化为Tensor类型 trans.append(torchvision.transforms.ToTensor()) #将图片增强方式添加到Compose 类中处理 transform = torchvision.transforms.Compose(trans) #读取训练数据 mnist_train = torchvision.datasets.FashionMNIST(root=root,train=True,download=False,transform = transform) #读取测试数据 mnist_test = torchvision.datasets.FashionMNIST(root = root,train=False,download=False,transform = transform) #数据加载器在训练测试阶段使用多线程按批采样数据默认不使用多线程 num_worker 表示设置的线程数量 train_iter = torch.utils.data.DataLoader(mnist_train,batch_size = batch_size,shuffle = True,num_workers = 2) test_iter = torch.utils.data.DataLoader(mnist_test,batch_size = batch_size,shuffle = False,num_workers = 2) return train_iter,test_iter batch_size = 16 #如出现“out of memory”的报错信息，可减小batch_size或resize train_iter,test_iter = load_data_fashion_mnist(batch_size,224) def train_fit(net,train_iter,test_iter,batch_size,optimizer,device,num_epochs): #将读取的数据拷贝到指定的GPU上 net = net.to(device) print("tainning on ",device) #设置损失函数交叉熵损失函数 loss = torch.nn.CrossEntropyLoss() #设置训练次数 for epoch in range(num_epochs): train_l_sum,train_acc_sum,n,batch_count,start = 0.0,0.0,0,0,time.time() # 读取批量数据进行训练 for X,y in train_iter: X = X.to(device) y = y.to(device) # 训练结果 y_hat = net(X) # 计算预测与标签分布差异 l = loss(y_hat,y) # 优化函数梯度置为零 # 1、因为梯度可以累加 # 2、每批采样的梯度不同，只需记录本次样本的梯度 optimizer.zero_grad() # 反向求导 l.backward() # 更新权重参数 optimizer.step() train_l_sum += l.cpu().item() #train_acc_sum += (torch.argmax(y_hat,dim = 1) == y).cpu().item() #将张量元素值累计 train_acc_sum += (y_hat.argmax(dim=1) == y).sum().cpu().item() n += y.shape[0] batch_count += 1 test_acc = evaluate_accuracy(test_iter,net) print(‘epoch %d, loss %.4f, train acc %.3f, test acc %.3f, time %.1f sec’ % (epoch + 1, train_l_sum / batch_count, train_acc_sum / n, test_acc, time.time() - start)) #创建Inception block class Inception(nn.Module): def init(self,in_c,c1,c2,c3,c4): super(Inception,self).init() self.p1_1 = nn.Conv2d(in_c,c1,kernel_size=1) self.p2_1 = nn.Conv2d(in_c,c1,kernel_size=1) self.p2_2 = nn.Conv2d(c2[0],c2[1],kernel_size=3,padding=1) self.p3_1 = nn.Conv2d(in_c,c3[0],kernel_size=1) self.p3_2 = nn.Conv2d(c3[0],c3[1],kernel_size=5,padding=2) self.p4_1 = nn.MaxPool2d(kernel_size=3,stride=1,padding=1) self.p4_2 = nn.Conv2d(in_c,c4,kernel_size=1) def forward(self, x): p1 = F.relu(self.p1_1(x)) p2 = F.relu(self.p2_2(F.relu(self.p2_1(x)))) p3 = F.relu(self.p3_2(F.relu(self.p3_1(x)))) p4 = F.relu(self.p4_2(F.relu(self.p4_1(x)))) return torch.cat((p1,p2,p3,p4),dim=1) b1 = nn.Sequential( nn.Conv2d(1,64,kernel_size=7,stride=2,padding=3), nn.ReLU(), nn.MaxPool2d(kernel_size=3,stride=2,padding=1) ) b2 = nn.Sequential( nn.Conv2d(64,64,kernel_size=1), nn.Conv2d(64,192,kernel_size=3,padding=1), nn.MaxPool2d(kernel_size=3,stride=2,padding=1) ) b3 = nn.Sequential( Inception(192,64,(96,128),(16,32),32), Inception(256,128,(128,192),(32,96),64), nn.MaxPool2d(kernel_size=3,stride=2,padding=1) ) b4 = nn.Sequential( Inception(192,64,(96,128),(16,32),32), Inception(512,160,(112,224),(24,64),64), Inception(512,128,(128,256),(24,64),64), Inception(512,112,(144,288),(32,64),64), Inception(528,256,(160,320),(32,128),128), nn.MaxPool2d(kernel_size=3,stride=2,padding=1) ) b5 = nn.Sequential( Inception(832,256,(160,320),(32,128),128), Inception(832,384,(192,384),(48,128),128), GlobalAvgPool2d() ) net = nn.Sequential(b1,b2,b3,b4,b5, FlattenLayer(), nn.Linear(1024,10) ) print(“net:\n”,net) X = torch.rand(1,1,96,96) for blk in net.children(): X = blk(X) print(“out shape”,X.shape) lr,num_epochs = 0.001,5 optimizer = torch.optim.Adam(net.parameters(),lr= lr) train_fit(net,train_iter,test_iter,batch_size,optimizer,device=device,num_epochs = num_epochs) 上训练图: PyTorch ------GoogLeNet卷积神经网络实现mnist手写体识别

PyTorch ------GoogLeNet卷积神经网络实现mnist手写体识别

GoogLeNet简介

GoogLeNet模型

继续阅读

pytorch：List中包含Tensor的grad数据怎么办？

问答机器人代码封装和对外提供接口代码封装和对外提供接口

数学建模智能优化算法之神经网络案例附Matlab代码

深度学习之卷积神经网络(CNN) — 理论与代码结合

深度学习之卷积神经网络CNN及tensorflow代码实现示例详细介绍(转载) 深度学习之卷积神经网络CNN及tensorflow代码实现示例详细介绍

突破！双一流大学，首篇Nature！

PALM病理性近视预测 2021-07-04飞桨常规赛：PALM病理性近视预测 6月第3名方案一、赛题介绍

Pytorch机器学习（九）—— YOLO中对于锚框，预测框，产生候选区域及对候选区域进行标注详解 Pytorch机器学习（九）—— YOLO中锚框，预测框，产生候选区域及对候选区域进行标注详解前言一、基本概念二、代码讲解总结

图形处理单元(GPU)的演进

CogView: Mastering Text-to-Image Generation via Transformers翻译摘要1.介绍2.方法3.Finetuning

【深度学习】损失函数记录0. 前言1. 正文参考文献

深度学习之卷积01 卷积02 填充Padding03 步幅Stride04 卷积核的选择05 多通道卷积参考

通俗理解查准率(precision)和查全率(recall)

人工智能如何有效地运用于自然语言处理

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

【Torch】最简洁logging使用指南