Pytorch学习记录（一）

2023-08-01 08:25:32

模型构建方法

class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()

        self.c1 = nn.Conv2d(3, 6 ,5)
        self.p = nn.MaxPool2d(2,2)
        self.c2 = nn.Conv2d(6, 16, 5)
        self.l1 = nn.Linear(16*5*5, 120)
        self.l2 = nn.Linear(120, 84)
        self.l3 = nn.Linear(84, 10)

    def forward(self, x):
        """前向传播过程"""
        # 卷积 过激活 池化
        x = self.p(func.relu(self.c1(x)))
        x = self.p(func.relu(self.c2(x)))

        # 全连接
        x = x.view(x.size(0), -1) # 全连接层前将向量特征拉直 -1代表由计算机进行计算
        x = func.relu(self.l1(x)) # .size(0)表示求第0维个数
        x = func.relu(self.l2(x))
        x = self.l3(x)

        return x

全连接第一层的输入为特征向量拉直后的个数。

损失函数构建方法

# 两种方案

# 1. 直接从functional模块中调用使用
loss = torch.nn.functional.cross_entropy(output, label)

# 2. 利用构造器构造损失函数 再调用
# CrossEntropy是个构造器
# 所以loss = torch.nn.CrossEntropyLoss()(output, target)这么写也对
loss_func = nn.CrossEntropyLoss()
loss = loss_func(output, label)

# 写成loss = torch.nn.CrossEntropyLoss(output, target) 则报错
# RuntimeError: bool value of Tensor with more than one value is ambiguous loss = 
# nn.CrossEntropy...

值得注意的是，关于pytorch中对标签的转换，如果使用了交叉熵损失函数，并不需要我们单独进行one-hot编码，因为该函数已经替我们执行了这一操作，我们只需要出入longtensor类型的label就可以

.item()方法

计算地到的loss是一个Tensor标量，需要使用.item()方法取出loss值

模型存取

# 模型快速存储
path = "./cifar_net.pth"           # .state_dict()是网络的状态字典
torch.save(net.state_dict(), path) # 存放训练过程中需要学习的权重和偏执系数

# 模型读取
net = CNN()
path = "./cifar_net.pth"
net.load_state_dict(torch.load(path))

GPU加速

# 需要分别将要训练的数据和模型都迁移至GPU上

# device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
device = torch.device("cuda:0")

net = CNN()
net.to(device)

inpt, label = data

inpt = inpt.to(device)
label = label.to(device)

CIFAR10数据集本地加载

对于官方下载数据集慢的方式，使用torchvision下载也很慢，所以参照之前解决MINIST数据集本地文件下载的方法：

使用torchvision下载MINIST及配置踩坑笔记

1、首先按照上面的链接提前下载好数据集

2、进入CIFAR10函数

3、修改url，将url由官网下载改成本地下载

Pytorch学习记录（一）

Pytorch学习记录（一）

继续阅读

考证大全 | 证券从业资格考试

敲黑板！2021年证券从业考试考点预测

2021年银行从业考试考情介绍,果断收藏!

证券从业合格证书什么时候打印？有哪些注意事项？

【干货满满】初级银行从业考试《个人理财》重点梳理

2020年经济师考试，难吗？

初级银行从业资格证有什么用？

MBA提前面试纯干货分享

MBA值得学么

吴恩达logistic回归实现

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

深度学习模型分析人类复杂疾病的准确性

【趋高机器视觉】机器视觉技术原理解析及解决方案

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

cs231n斯坦福基于卷积神经网络的CV学习笔记（一）KNN和线性分类器/分类器损失/反向传播一，KNN图像分类算法二，线性分类器三，线性分类器损失四，反向传播五，神经网络

【Torch】最简洁logging使用指南