天天看點

GAN誕生記:最火的AI模型,來自一群博士的酒後争吵GAN鬥酒Code百行開端

本文來自AI新媒體量子位(QbitAI)

GAN誕生記:最火的AI模型,來自一群博士的酒後争吵GAN鬥酒Code百行開端

費曼去世時,他教室裡的黑闆寫着:“我無法了解自己創造不出來的事物。”

這句名言被Ian Goodfellow在解釋他正在谷歌大腦進行的研究時所借用。但這次,Goodfellow指的不是他自己,也不是谷歌内部的任何一個人,而是機器。

“AI了解不了自己不能創造的東西。”Goodfellow說。

離開OpenAI回到谷歌之後,Goodfellow成立了一個全新的小組來對生成模型進行研究。生成模型,簡單來說就是對影像、聲音以及對現實世界的一切其他“表示”(representations)進行創造的系統,Goodfellow認為,它将成為通往各種形式人工智能的一條重要路徑。

“如果AI學會了構想現實世界中的種種細節——比如現實中的圖像和聲音,這将幫助AI更好地了解現實世界的結構、架構。”Goodfellow解釋說,“AI也将更容易去了解它的所見所聞。”

2014年,Goodfellow還是蒙特利爾大學的一名博士生。在微醉與同學進行了一次論争後,Goodfellow在酒吧裡想出了名為“生成對抗網絡”(GAN)的AI技術。這是種非常奇妙的想法:用一個AI對現實世界的圖像進行創造,再用另一個AI去分析結果并對圖像的真僞進行識别。

“你可以将二者的關系想象成一個藝術家和一個文藝批評家。”Goodfellow說,“作為藝術家,生成模型希望愚弄藝術批評家,讓後者認為它畫出來的東西是真實的。”因為“藝術批評家”如此努力地将這些“畫”辨認為假,“藝術家”就慢慢學會了摹拟那些真的東西,而這原本是隻靠它自己所不能做到的。

在這樣的過程中,這兩種神經網絡會推動着AI向前進步,直到AI不再需要人類作為自己的老師。

Facebook的AI研究負責人楊立昆(Yann LeCun)将GAN稱作“過去20年内在深度學習上最酷的想法”。Goodfellow的想法在很大程度上還處在發展之中,但這些想法已經在AI的圈子内迅速傳播。包括楊立昆在内的很多研究者都認為,這些想法将會促成“無監督學習”的實作。

GAN誕生記:最火的AI模型,來自一群博士的酒後争吵GAN鬥酒Code百行開端

△ Ian Goodfellow

Goodfellow構思出這個想法時,是在加拿大蒙特利爾一家名叫“三個釀酒師”的酒吧裡。當時,他和一些同學來為剛剛完成博士學業的Razvan Pascanu送行。其中一位同學向大家描述了一項新的研究計劃——将圖像上的所有内容都識别成數學元素,然後将這些資料輸入機器,使後者能創造新的圖像。

此時,已經微醺的Goodfellow說,這種方法永遠不會奏效,因為需要考慮的資料實在太多了,沒有人能把它們全部記錄下來。也是在這個時候,Goodfellow想出了他認為更好的辦法:能夠教會機器創造現實圖像的神經網絡。

Goodfellow确信,如果要用一個神經網絡創造圖像,那麼就可以用另一個神經網絡扮演它的對手來判斷圖像的真僞,并将這些判斷結果回報給第一個網絡。最終,第一個神經網絡将學會足以亂真的假圖像。

一場争論就這麼發生了,那位同學同樣堅如磐石地認為Goodfellow的辦法不會有用。于是,Goodfellow當晚就回家做了一個東西出來。“我回家時還是醉着的,而我的女朋友那時已經睡着了。我坐在那想的隻有:我的朋友在酒吧裡說的是錯的!”他回憶說,“我熬夜在自己的筆記本電腦上寫出了GAN。”結果代碼第一次工作就成功了。

“那非常幸運。因為如果那沒有奏效,我可能就要放棄這個想法了。”Goodfellow說。

後來他和幾位研究者發表了一篇闡述這種想法的論文。在那三年之後,已經有成百上千的論文對這個概念進行了闡發。在第一篇論文裡,兩個神經網絡制作出了一個能生成真實手寫數字的系統。現在,研究者們将這種想法應用在照片上——從一隻貓,到龍卷風甚至整個星系。這種技術甚至可以用來進行天文實驗和模拟粒子實體。

但這目前仍然非常難以實作。它不光是對一個神經網絡的訓練,而是要在兩個神經網絡上同時進行。Goodfellow在谷歌成立專注于GANs的研究團隊,希望對這種過程進行精煉。

結果遠比預期的要好,它不僅能用于生成圖像和聲音,還能用來識别圖像和聲音,而這隻需要很少來自人類方面的幫助。“這些模型學會了了解世界的架構。”Goodfellow解釋說,“這同樣能幫助系統在不需要被精确告知的情況下學習。”

無監督學習在今天還未成真,而GANs可以促進它的實作。如今,神經網絡可以通過分析幾百萬張貓的照片來對一隻貓進行識别,但人類必須十分謹慎地對那些貓的照片進行标注。人仍然非常多地參與到其中,而人的偏見在訓練AI的過程中發揮了多大的作用同樣是一個問題。LeCun這樣的研究者正在推動系統向無監督學習狀态演進,而這一旦實作,也将大大加速AI的進化。

但那隻是一個開始,GAN帶來了很多其他的可能性。南加州大學的AI研究院David Kale相信,這個創意可以幫助他和同僚們在不侵犯患者隐私的情況下開發醫療AI。GAN可以制造假的醫療記錄,讓機器學習系統在其上進行訓練,不需要真實資料。

“與其把真實的患者記錄扔在網際網路上讓各種人用,我們為什麼不在那些記錄的基礎上訓練一個GAN,然後用它生成一個能夠以假亂真的虛拟的資料集開放給開發者呢?”

盡管很多研究者都在圍繞GAN進行探索,但據說Goodfellow堅持要特别在Google建立他的團隊。他是離開Google去了人工智能非營利機構OpenAI的研究人員之一,但不到一年之後,他就回到了Google,因為那是他的夥伴們所在的地方。

“把整天時間花在電話會議上,并不好玩,也并不是完成工作的最佳方式。”

分享很重要,緊密的合作也很重要。對AI研究者來說、對神經網絡來說,都是這樣。

本文作者:唐旭 李林

原文釋出時間:2017-04-12

繼續閱讀