梯度累加是什么意思-详解

2023-05-23 12:40:50

每次看到“梯度是累加的，所以需要清除梯度”这句话都感觉云里雾里，貌似懂了实际没懂，原来竟是这么简单的意思！

1、直接上代码：

import torch

x = torch.Tensor([1, 2, 3])
x.requires_grad_()
print(x)
y = x**2

 # 连续调用backward时，需要retain_graph=True确保计算图暂时不被释放
y.sum().backward(retain_graph=True) 
print(x.grad)
y.sum().backward()
print(x.grad)  # 如果梯度不归零的话，梯度是累加的

运行结果是：

tensor([1., 2., 3.], requires_grad=True)
tensor([2., 4., 6.])
tensor([ 4.,  8., 12.])

第一次调用backward反向传播，结果是（2 4 6），中间没有梯度清零，第二次调用backward反向传播，又有了一波结果（2 4 6），加在之前的结果上就得了（4 8 12）

2、接下来，我们在两次调用之间加一个梯度清零操作看看：

import torch

x = torch.Tensor([1, 2, 3])
x.requires_grad_()
print(x)
y = x**2

y.sum().backward(retain_graph=True)  # 连续调用backward时，需要retain_graph=True确保计算图暂时不被释放
print(x.grad)
x.grad.zero_()
y.sum().backward()
print(x.grad)  # 如果梯度不归零的话，梯度是累加的

运行结果是：

tensor([1., 2., 3.], requires_grad=True)
tensor([2., 4., 6.])
tensor([2., 4., 6.])

梯度累加是什么意思-详解

继续阅读

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

吴恩达机器学习笔记（3）

吴恩达j机器学习之过拟合

吴恩达机器学习(一) 介绍

深度学习模型分析人类复杂疾病的准确性

疾病研究：重症肌无力

人工智能如何有效地运用于自然语言处理

新闻 | Mapbox 牵手阿里，飞猪旅行上线六大城市地图功能

【趋高机器视觉】机器视觉技术原理解析及解决方案

[HTML5]自定义属性 data-* 和 jQuery.data 详解

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告

cs231n斯坦福基于卷积神经网络的CV学习笔记（一）KNN和线性分类器/分类器损失/反向传播一，KNN图像分类算法二，线性分类器三，线性分类器损失四，反向传播五，神经网络

2021年危险化学品经营单位安全管理人员考试题库及危险化学品经营单位安全管理人员考试技巧

【Torch】最简洁logging使用指南

无人机--飞控科普