生成式對抗網絡GAN（Generative Adversarial Nets）論文筆記

2023-07-29 11:17:48

1.介紹

本文基本從《Generative Adversarial Nets》翻譯總結的。

GAN（Generative Adversarial Nets），生成式對抗網絡。包含兩個模型，一個生成模型G，用來捕捉資料分布，一個識别模型D，用來評估采樣是來自于訓練資料而不是G的可能性。

這兩個模型G與D是競争關系、敵對關系。比如生成模型G就像是在制造假的貨币，而識别模型D就像是警察，嘗試檢測這些假币。這兩個模型間的競争，使它們都在不斷完善自己，直到假币和真币無法區分為止。

本論文的例子，訓練兩個模型時僅使用了反向傳播和dropout 算法，在從生成模型中采樣時，隻使用的前向傳播。近似推理或者Markov chain是不必要的。

（1）定向圖模型與非定向圖模型，比如限制玻爾茲曼機（RBMs）、深度玻爾茲曼機(DBMs)、以及相關變體。這些模型使用了歸一化處理，針對随機參數的所有狀态。這些歸一化比例函數以及他們的梯度是很難計算的，雖然可以采用Markov chain Monte Carlo（MCMC）方法進行估計。

（2）DBNs(Deep belief networks) 是組合模型，包括一個非定向層和一堆定向層。當一個快速近似逐層訓練存在時，DBNs在集合非定向與定向模型時也會面臨計算困難的問題。

（3）生成随機網絡GSN, 使用了Markov chain。而GAN不需要Markov chain，因為在生成時，不需要反向傳播。

p（z）:帶有噪聲的輸入；

G（z,θ）:一個可微分的函數，帶參數θ的多層感覺機；

D（x）:代表x是來自于data還是來自于生成函數的機率。

整體訓練函數如下，最大化D，同時針對G來最小化log（1-D（G（z）））：