PyTorch之Variable的detach和detach_

2023-08-01 06:48:13

本文源自：https://blog.csdn.net/u012436149/article/details/76714349

這裡加入自己的一點實踐。

pytorch 的 Variable 對象中有兩個方法，detach和 detach_ 本文主要介紹這兩個方法的效果和能用這兩個方法幹什麼。

detach

官方文檔中，對這個方法是這麼介紹的。

傳回一個新的從目前圖中分離的 Variable。
傳回的 Variable 永遠不會需要梯度
如果被 detach 的Variable volatile=True，那麼 detach 出來的 Variable volatile 也為 True
還有一個注意事項，即：傳回的 Variable 和被 detach 的Variable 指向同一個 tensor

import torch
from torch.nn import init
from torch.autograd import Variable
t1 = torch.FloatTensor([1., 2.])
v1 = Variable(t1)
t2 = torch.FloatTensor([2., 3.])
v2 = Variable(t2)
v3 = v1 + v2
v3_detached = v3.detach()
v3_detached.data.add_(t1) # 修改了 v3_detached Variable中 tensor 的值
print(v3, v3_detached)    # v3 中tensor 的值也會改變

# detach 的源碼
def detach(self):
    result = NoGrad()(self)  # this is needed, because it merges version counters
    result._grad_fn = None
    return result

detach_

官網給的解釋是：将 Variable 從建立它的 graph 中分離，把它作為葉子節點。

從源碼中也可以看出這一點

将 Variable 的grad_fn 設定為 None，這樣，BP 的時候，到這個 Variable 就找不到它的 grad_fn，是以就不會再往後BP了。
将 requires_grad 設定為 False。這個感覺大可不必，但是既然源碼中這麼寫了，如果有需要梯度的話可以再手動将 requires_grad 設定為 true
還有一點：加下劃線的會改變變量本身。

# detach_ 的源碼
def detach_(self):
    """Detaches the Variable from the graph that created it, making it a
    leaf.
    """
    self._grad_fn = None
    self.requires_grad = False

能來幹啥

如果我們有兩個網絡 A,B, 兩個關系是這樣的 y=A(x),z=B(y)。現在我們想用 z.backward()來為 B 網絡的參數求梯度，但是又不想求 A 網絡參數的梯度。我們可以這樣：

# y=A(x), z=B(y) 求B中參數的梯度，不求A中參數的梯度
# 第一種方法
y = A(x)
z = B(y.detach())
z.backward()

# 第二種方法
y = A(x)
y.detach_()
z = B(y)
z.backward()

在這種情況下，

detach 和 detach_

都可以用。但是如果你也想用 y 來對 A進行 BP 呢？那就隻能用第一種方法了。因為第二種方法已經将 A 模型的輸出給 detach（分離）了。

自己的實踐：

detach()方法可以用在GAN中，對判别器的參數求梯度而對生成器的參數不求梯度。例如：

def backward_D(self):
        # Fake
        # stop backprop to the generator by detaching fake_B
        if self.iscGAN:
            fake_AB = self.fake_AB_pool.query(torch.cat((self.real_A, self.fake_B), 1).data)
        else:
            fake_AB = self.fake_AB_pool.query(self.fake_B.data)
        pred_fake = self.netD(fake_AB.detach())# stop BP to G
        self.loss_D_fake = self.criterionGAN(pred_fake, False)

PyTorch之Variable的detach和detach_

detach

detach_

繼續閱讀

考證大全 | 證券從業資格考試

敲黑闆！2021年證券從業考試考點預測

2021年銀行從業考試考情介紹,果斷收藏!

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

【趨高機器視覺】機器視覺技術原了解析及解決方案

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

【Torch】最簡潔logging使用指南