Pytorch nn.BCEWithLogitsLoss()的簡單了解與用法

2023-04-15 06:59:00

這個東西，本質上和nn.BCELoss()沒有差別，隻是在BCELoss上加了個logits函數(也就是sigmoid函數)，例子如下：

import torch
import torch.nn as nn

label = torch.Tensor([1, 1, 0])
pred = torch.Tensor([3, 2, 1])
pred_sig = torch.sigmoid(pred)
loss = nn.BCELoss()
print(loss(pred_sig, label))

loss = nn.BCEWithLogitsLoss()
print(loss(pred, label))

loss = nn.BCEWithLogitsLoss()
print(loss(pred_sig, label))

輸出結果分别為：

tensor(0.4963)
tensor(0.4963)
tensor(0.5990)

可以看到，nn.BCEWithLogitsLoss()相當于是在nn.BCELoss()中預測結果pred的基礎上先做了個sigmoid，然後繼續正常算loss。是以這就涉及到一個比較奇葩的bug，如果網絡本身在輸出結果的時候已經用sigmoid去處理了，算loss的時候用nn.BCEWithLogitsLoss()…那麼就會相當于預測結果算了兩次sigmoid，可能會出現各種奇奇怪怪的問題——

比如網絡收斂不了（流淚貓貓頭.jpg）

Ref

[1] https://zhuanlan.zhihu.com/p/170558960

Pytorch nn.BCEWithLogitsLoss()的簡單了解與用法

Ref

繼續閱讀

PyTorch自動混合精度訓練(AMP)手冊PyTorch自動混合精度訓練(AMP)手冊

PyTorch的自動混合精度（AMP）

Pytorch自動混合精度(AMP)介紹與使用Pytorch自動混合精度(AMP)介紹與使用

關于半精度fp16的混合訓練fp16fp16&fp32混合精度訓練

pytorch 基于 apex.amp 的混合精度訓練：原理介紹與實作

9、TORCH.UTILS.MODEL_ZOO

梯度累加及torch實作1. 什麼是梯度累加2. 梯度累加的過程3. 實驗4. 參考

torch.nn.Upsample實作上采樣

深度學習的一些小記錄裡面有一部分是摘錄

LabelImg的安裝與使用（Anaconda環境）Labellmg的安裝

pytorch：List中包含Tensor的grad資料怎麼辦？

Pytorch機器學習（九）—— YOLO中對于錨框，預測框，産生候選區域及對候選區域進行标注詳解 Pytorch機器學習（九）—— YOLO中錨框，預測框，産生候選區域及對候選區域進行标注詳解前言一、基本概念二、代碼講解總結

CogView: Mastering Text-to-Image Generation via Transformers翻譯摘要1.介紹2.方法3.Finetuning

【深度學習】損失函數記錄0. 前言1. 正文參考文獻

深度學習之卷積01 卷積02 填充Padding03 步幅Stride04 卷積核的選擇05 多通道卷積參考

【Torch】最簡潔logging使用指南