pytorch中的out.backward()详解定义m=(m1,m2)=(2,3),，记为k=（k1,k2）ki对mi求导的jacobian矩阵是：而backward函数的参数FloatTensor([1/0,1/0])，其实是：的值。而具体计算各个梯度的方式为：所以对backward的参数不同取值相当于决定每个偏导数的系数是多少，也就是k对ki的导数的值。

2023-08-07 12:59:45

如果out是个标量的话backward()里面就不用写了，也就是默认是1，大部分的loss都是这样的，这个比较简单了就不详解了。

以下博客内容部分参考自博客https://sherlockliao.github.io/2017/07/10/backward/

定义m=(m1,m2)=(2,3),

pytorch中的out.backward()详解定义m=(m1,m2)=(2,3),，记为k=（k1,k2）ki对mi求导的jacobian矩阵是：而backward函数的参数FloatTensor([1/0,1/0])，其实是：的值。而具体计算各个梯度的方式为：所以对backward的参数不同取值相当于决定每个偏导数的系数是多少，也就是k对ki的导数的值。
，记为k=（k1,k2）

计算k对于m1和m2的梯度：(m1,m2对应下图的x1，x2)

接下来使用代码来实现k对m1和m2的梯度

from torch.autograd import Variable as v
import torch
j = torch.zeros(2 ,3)
k = v(torch.zeros(1, 2))
m.grad.data.zero_()
k[0, 0] = m[0, 0] ** 2 + 3 * m[0 ,1]
k[0, 1] = m[0, 1] ** 2 + 2 * m[0, 0]
k.backward(torch.FloatTensor([[1, 1]]), retain_graph =True) # 需要san次反向求导
j[:,0]=m.grad.data
m.grad.data.zero_()
# [1, 0] dk0/dm0, dk1/dm0
k.backward(torch.FloatTensor([[1, 0]]), retain_graph =True) # 需要两次反向求导
j[:, 1] = m.grad.data
m.grad.data.zero_()
# [0, 1] dk0/dm1, dk1/dm1
k.backward(torch.FloatTensor([[0, 1]]))
j[:, 2] = m.grad.data
print('jacobian matrix is')
print(j)

输出：

分析一下：

ki对mi求导的jacobian矩阵是：

而backward函数的参数FloatTensor([1/0,1/0])，其实是：

pytorch中的out.backward()详解定义m=(m1,m2)=(2,3),，记为k=（k1,k2）ki对mi求导的jacobian矩阵是：而backward函数的参数FloatTensor([1/0,1/0])，其实是：的值。而具体计算各个梯度的方式为：所以对backward的参数不同取值相当于决定每个偏导数的系数是多少，也就是k对ki的导数的值。
的值。

而具体计算各个梯度的方式为：

所以对backward的参数不同取值相当于决定每个偏导数的系数是多少，也就是k对ki的导数的值。

ki对mi求导的jacobian矩阵是：

而backward函数的参数FloatTensor([1/0,1/0])，其实是：

而具体计算各个梯度的方式为：

所以对backward的参数不同取值相当于决定每个偏导数的系数是多少，也就是k对ki的导数的值。

继续阅读

PyTorch自动混合精度训练(AMP)手册PyTorch自动混合精度训练(AMP)手册

PyTorch的自动混合精度（AMP）

Pytorch自动混合精度(AMP)介绍与使用Pytorch自动混合精度(AMP)介绍与使用

关于半精度fp16的混合训练fp16fp16&fp32混合精度训练

pytorch 基于 apex.amp 的混合精度训练：原理介绍与实现

9、TORCH.UTILS.MODEL_ZOO

梯度累加及torch实现1. 什么是梯度累加2. 梯度累加的过程3. 实验4. 参考

torch.nn.Upsample实现上采样

深度学习的一些小记录里面有一部分是摘录

LabelImg的安装与使用（Anaconda环境）Labellmg的安装

pytorch：List中包含Tensor的grad数据怎么办？

Pytorch机器学习（九）—— YOLO中对于锚框，预测框，产生候选区域及对候选区域进行标注详解 Pytorch机器学习（九）—— YOLO中锚框，预测框，产生候选区域及对候选区域进行标注详解前言一、基本概念二、代码讲解总结

CogView: Mastering Text-to-Image Generation via Transformers翻译摘要1.介绍2.方法3.Finetuning

【深度学习】损失函数记录0. 前言1. 正文参考文献

深度学习之卷积01 卷积02 填充Padding03 步幅Stride04 卷积核的选择05 多通道卷积参考

【Torch】最简洁logging使用指南