model.train()&&model.eval()&&with torch.no_grad()用法

2023-06-08 08:49:44

1.model.train()

啟用 Batch Normalization 和 Dropout

如果模型中有BN層(Batch Normalization）和Dropout，需要在訓練時添加model.train()。model.train()是保證BN層能夠用到每一批資料的均值和方差。對于Dropout，model.train()是随機取一部分網絡連接配接來訓練更新參數。

用法：注意model.train()的位置

for epoch in range(num_epoches):
        running_loss = torch.Tensor([0]).to(device)
        pbar = tqdm(enumerate(trainloader), total=len(trainloader),position=0)
        model.train()
        for i, data in pbar:
            path_img, img, labels = data
            img, labels = img.to(device), labels.to(device)
            optimizer.zero_grad()
            out = model(img)
            c = out.size()
            loss = criterion(out, labels.long())
            loss.backward()
            optimizer.step()

model.train()一定要是在epoch中并且在dataloader循環前的位置上

2.model.eval

不啟用 Batch Normalization 和 Dropout

如果模型中有BN層(Batch Normalization）和Dropout，在測試時添加model.eval()。model.eval()是保證BN層能夠用全部訓練資料的均值和方差，即測試過程中要保證BN層的均值和方差不變。對于Dropout，model.eval()是利用到了所有網絡連接配接，即不進行随機舍棄神經元。

model.eval()
    with torch.no_grad():
        pbar = tqdm(enumerate(testloader), total=len(testloader),position=0)
        for i, data in pbar:
            path_img, img, labels = data
            img, labels = img.to(torch.float32).to(device),
labels.to(torch.float32).to(device)
            d = img.size()
            e = labels.size()
            out = model(img)
            f = out.size()
            _, pred = torch.max(out.data, 1)

3.with torch.no_grad()

with torch.no_grad()則主要是用于停止autograd子產品的工作，以起到加速和節省顯存的作用。它的作用是将該with語句包裹起來的部分停止梯度的更新，進而節省了GPU算力和顯存，但是并不會影響dropout和BN層的行為。

model.train()&&model.eval()&&with torch.no_grad()用法

1.model.train()

model.train()一定要是在epoch中并且在dataloader循環前的位置上

2.model.eval

注意：在測試模型時候，記得在with torch.no_grad()前面加上model.eval() ，不加model.eval() 會導緻測試精度很低

繼續閱讀

TestLink導出用例轉換工具(XML2Excel)

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入

model.train()&amp;&amp;model.eval()&amp;&amp;with torch.no_grad()用法

1.model.train()

model.train()一定要是在epoch中并且在dataloader循環前的位置上

2.model.eval

注意：在測試模型時候，記得在with torch.no_grad()前面加上model.eval() ，不加model.eval() 會導緻測試精度很低

繼續閱讀

model.train()&&model.eval()&&with torch.no_grad()用法