Ian Goodfellow回憶GAN誕生故事：幾杯啤酒喝出“20年來最酷的深度學習想法”

當ian goodfellow解釋他在谷歌大腦所做的研究時，他引用了原子實體學家、加州理工學院教授兼暢銷書作家的這句格言。但是，goodfellow不是指自己，也不是google内的任何其他人。他談論的，是機器：“ai不能創造的，便是它不明白的（what an ai cannot create, it does not understand）”。

ian goodfellow在推特上轉發這篇文章：

關于gan的誕生往事

goodfellow是世界上最重要的ai研究人員之一，在elon musk和sam altman建立的谷歌大腦競逐對手openai短暫工作後，他傳回谷歌，建立了一個新的研究小組，探索“生成模型”——一個可以創造現實世界的照片，聲音和其他表征的系統。 goodfellow引用feynman的名言，将這一努力描述成通往各種人工智能的重要途徑。

他解釋說：“如果ai能學習如何想象現實的圖像和逼真的聲音——這将鼓勵ai了解世界的實際結構。它可以幫助ai了解它看到的圖像或它聽到的聲音。”

幾杯啤酒後誕生的

“20年來最酷的深度學習思想” gan

▼

2014年，當時還在蒙特利爾大學讀博士的goodfellow，在一家酒吧微醺後，想到了一種稱為“生成對抗網絡（generative adversarial networks）”或gan的ai技術。盡管這個想法來自幾罐啤酒，其仍不失為一個非常優雅的設計：一個ai嘗試創造它認為真實的圖像，而第二個ai分析結果，并嘗試确定圖像是真實還是假的。 goodfellow說：“你可以把它們當作藝術家和藝術評論家，生成模型想要愚弄藝術評論家 ——讓藝術批評家把它所産生的圖像當成真的”。因為第二個ai努力地識别造出來的假圖像，是以第一個ai得以學會模仿真實世界。這種方式，是一個單獨的ai無法完成的，。在這個過程中，這兩個神經網絡可以将ai推向某一天，電腦宣布獨立于他們的人類老師。

監管facebook人工智能研究的yann lecun将gan稱為“過去20年來最酷的深度學習思想”。深度學習是一種ai，它正在改變所有網際網路最大的公司的方向，包括谷歌，微軟，和亞馬遜，以及facebook。 goodfellow的想法還在不斷發展，但它們已經快速傳遍ai社群。許多研究人員，包括lecun，相信他們可以導緻“無監督學習”，這是ai研究領域的巨大願望：機器學習無需人類的直接幫助。

做正确的事

goodfellow得到這個靈感時，是位于蒙特利爾酒吧名為les 3 brasseurs，或“三個釀酒師”的酒吧。他的朋友razvan pascanu，現在是google的另一個ai實驗室deepmind的研究員，彼時剛完成了他的博士學習，很多朋友聚集一堂送别他。其中一個正在描述一個新的研究項目，試圖用數學方法确定進入照片的所有内容。這個想法是将這些統計資訊輸入一台機器，以便它可以自己建立照片。半醉中，goodfellow說這是永遠不會有效的 —— 要考慮的統計量太多，沒有人能全部記錄下來。就在這一刻，他想到了一個更好的方法：神經網絡可以教會機器如何建立逼真的照片。

神經網絡是一種比較複雜的數學思維，它通過識别照片中的人臉和口語了解分析大量資料來進行學習任務。

在酒吧裡，goodfellow決定使用現實的照片來建構神經網絡學習，然後可以與其他進行對比，來試圖辨識照片是否為假，實際上，這一切是依據它們第一次的感覺來判斷。

他表示通過這種方式，它最終可以成為第一個使用神經網絡生成并與真實事物無法分辨的虛假圖像。

争議随之而來，goodfellow的朋友們堅持認為這種方法行不通。是以當他晚上到家的時候，他開始進行這項試驗。“當我回家的時候我有點喝醉了，我的女朋友也已經熟睡了。”

我坐着那兒思考：酒吧裡我的朋友們他們都想錯了！他回憶着說，當時我連夜在筆記本電腦裡完成了gans的代碼。

按照他的說法，程式代碼第一次測試就正常運作了。“這是真的，真的很幸運，”他說道，“如果不是因為第一次代碼就成功，我可能已經放棄這個想法了。”

他和其他的一些研究人員在那年晚些時候發表了一篇論文，闡述了這個想法。在那之後的三年，已經有數百篇論文來探讨這一概念。

更智能的ai

也許不再需要人類

在第一篇論文中表示，這兩種神經網絡可以産生一種能夠生成手寫數字的現實圖像的系統。

如今，研究人員正将這個想法在從貓到火山再到整個星系的各種照片上應用。

它甚至可以幫助進行天文學試驗和模拟粒子實體學試驗。但這仍然是一件非常困難的事情，它不僅需要訓練一個神經網絡，還需要兩個神經網絡同時運作。

在谷歌，他成立了一個專注于gans和相關研究的新團隊，goodfellow希望能優化這一過程，他表示道：“最重要的是，作為一名機器學習研究者，我得不斷對它們進行有效的訓練。”

最終的結果：神經網絡系統不僅能夠更好地生成圖像與聲音，還能識别它們，這是一種能夠在人類的輔助下獲得更多的資訊的系統。系統模型會嘗試學習并了解世界的構造。goodfellow表示道：可以幫助系統在沒有明确背景資訊的情況下盡可能多的學習。

gans甚至可能達到一項迄今未能實作的目标，即在無人監管的情況下自主學習。目前，神經網絡可以通過分析上百萬幅貓的圖檔學會對其進行識别，在此過程中，人類必須仔細對這些圖檔進行分析并進行标注。目前，人類仍在機器學習中不可或缺，而随之帶來的個人偏見和對大量人類勞動的需求，常常正是ai訓練的問題所在。諸如lecun等ai研究學者正着力推動可顯著加速ai發展進化，無須大量人類參與的學習系統研究。

然而這僅僅是開始。gans将帶來許多其他可能。david kale,南加州大學的ai研究學者，相信這個創意可以幫助他和他的同僚在不侵犯患者隐私的情況下來建立一個健康護理ai。機器學習系統可以基于假想資料替代真實資料進行訓練。“比起把病人病曆大規模上傳到網絡供人使用，為什麼不創造一個向研究者開放的完全虛拟資料庫以訓練gans呢？”kale說，“如果基于該資料庫的訓練模型和原始資料訓練結果毫無差異，我們又何樂而不為呢？”

原文釋出時間為：2017-04-12

本文來自雲栖社群合作夥伴“大資料文摘”，了解相關資訊可以關注“bigdatadigest”微信公衆号

Ian Goodfellow回憶GAN誕生故事：幾杯啤酒喝出“20年來最酷的深度學習想法”

繼續閱讀

K-近鄰算法以及圖像分類應用

小i機器人受邀赴韓交流，CFO首爾亞洲金融論壇演講

吳恩達deeplearning

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普