梯度累加是什麼意思-詳解

2023-05-23 12:40:50

每次看到“梯度是累加的，是以需要清除梯度”這句話都感覺雲裡霧裡，貌似懂了實際沒懂，原來竟是這麼簡單的意思！

1、直接上代碼：

import torch

x = torch.Tensor([1, 2, 3])
x.requires_grad_()
print(x)
y = x**2

 # 連續調用backward時，需要retain_graph=True確定計算圖暫時不被釋放
y.sum().backward(retain_graph=True) 
print(x.grad)
y.sum().backward()
print(x.grad)  # 如果梯度不歸零的話，梯度是累加的

運作結果是：

tensor([1., 2., 3.], requires_grad=True)
tensor([2., 4., 6.])
tensor([ 4.,  8., 12.])

第一次調用backward反向傳播，結果是（2 4 6），中間沒有梯度清零，第二次調用backward反向傳播，又有了一波結果（2 4 6），加在之前的結果上就得了（4 8 12）

2、接下來，我們在兩次調用之間加一個梯度清零操作看看：

import torch

x = torch.Tensor([1, 2, 3])
x.requires_grad_()
print(x)
y = x**2

y.sum().backward(retain_graph=True)  # 連續調用backward時，需要retain_graph=True確定計算圖暫時不被釋放
print(x.grad)
x.grad.zero_()
y.sum().backward()
print(x.grad)  # 如果梯度不歸零的話，梯度是累加的

運作結果是：

tensor([1., 2., 3.], requires_grad=True)
tensor([2., 4., 6.])
tensor([2., 4., 6.])

梯度累加是什麼意思-詳解

繼續閱讀

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

【趨高機器視覺】機器視覺技術原了解析及解決方案

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

【Torch】最簡潔logging使用指南

無人機--飛控科普