天天看點

GAN之父Ian Goodfellow :那個賦予機器想象力的人類

通過使用兩個神經網絡的互相對抗,Ian Goodfellow創造了一個強大的AI工具。而現在,他以及我們所有人都必須開始面對其所帶來的後果了。

*本文系mit technology review的人物特寫,希望閱讀英文原文的讀者請拉至文末檢視原文連結。

2014年的一晚,Ian Goodfellow和一個剛剛畢業的博士生一起喝酒慶祝。在蒙特利爾一個酒吧,一些朋友希望他能幫忙看看手頭上一個棘手的項目:計算機如何自己生成圖檔。

研究人員已經使用了神經網絡(模拟人腦的神經元網絡的一種算法),作為生成模型來創造合理的新資料。但結果往往不盡人意。計算機生成的人臉圖像通常不是模糊不清,就是缺耳少鼻。

Ian Goodfellow朋友們提出的方案是對那些組成圖檔的元素進行複雜的統計分析以幫助機器自己生成圖檔。這需要進行大量的資料運算,Ian Goodfellow告訴他們這根本行不通。

邊喝啤酒邊思考問題時,他突然有了一個想法。如果讓兩個神經網絡互相對抗會出現什麼結果呢?他的朋友對此持懷疑态度。

當他回到家,他女朋友已經熟睡,他決定馬上實驗自己的想法。那天他一直寫代碼寫到淩晨,然後進行測試。第一次運作就成功了!

那天晚上他提出的方法現在叫做GAN,即生成對抗網絡(generative adversarial network)。

該方法已經在機器學習領域産生了巨大的影響,也讓他的創造者Goodfellow成為了人工智能界的重要人物。

GAN之父Ian Goodfellow :那個賦予機器想象力的人類

在最近幾年,通過深度學習技術,AI研究人員取得了令人矚目的進展。向深度學習系統輸入足夠的圖像,它就能進行學習,比如識别出一個将要過馬路的行人。這一技術使得自動駕駛技術,Alexa、Siri等會話技術支援的虛拟助手成為可能。

這标志着無監督學習的一大飛躍

雖然使用深度學習的人工智能工具們能夠學習如何識别事物,但它們并不擅長創造事物。而GANs的目标就是賦予計算機類似于想象力的東西。

要實作這一功能并不是簡單的讓它們能夠畫漂亮的圖檔或者譜優美的歌曲,而是要讓它們盡量少的依賴人類來告訴它們世界該是什麼樣子以及它們該怎麼工作。

如今,AI程式員通常需要明确告訴機器輸入的訓練資料是什麼,即一百萬張圖檔中哪些圖檔是過馬路的行人以及哪些不是。而這樣的過程不僅花費極大,需要大量人工參與,還限制了系統對于一些稍微偏離訓練集的資料的處理。

未來,計算機将會更好地消化原始資料,并沒有明确指令的情況下,從原始資料中找出它們需要從中學習的東西。

這将标志着 “無監督學習”的一大飛躍。無需離開車庫,自動駕駛汽車就可以自學如何處理不同的路況;無需四處走動,機器人就能夠預估到在一個忙碌的倉庫中可能遇到的障礙。

我們能夠想象和思考不同的場景,這是我們作為人的一部分。當未來技術方面的曆史學家回過頭來看時,可能會把GAN方法的提出看作是邁向創造具有類人意識機器的一大步。臉書的人工智能首席科學家Yann LeCun将GAN稱之為‘近20年來深度學習領域最棒的想法’。

前百度大腦首席科學家吳恩達認為GAN代表着“一項重大而根本性的進步”,它鼓舞了全球越來越多的研究人員。

神奇的GAN和它廣泛的應用

同樣讓人驚訝的是,他已經發現有人在用GAN達到不法目的,是以他現在大部分的時間都花在對抗壞人,應對這些壞行為上。

它模仿一名圖檔僞造者和一名藝術鑒定師之間想要打敗對方的交鋒過程。這兩個網絡都在同樣的資料集上訓練,第一個網絡稱作生成器,生成器用來生成仿造的輸出如圖檔或者筆迹,仿造得越真實越好。

第二個網絡稱作判别器,将生成器生成的圖檔與訓練集中真實的圖檔進行比較,然後判斷哪些圖檔是真實的哪些是假的。根據判定器的結果,生成器将更新參數,然後生成新的圖檔。如此循環,直到判别器不再能判斷圖檔的真僞。

GAN之父Ian Goodfellow :那個賦予機器想象力的人類

一位使用真實名人照片進行教育訓練的GAN,自己創造出了一系列想象中的明星。

在去年一個衆所周知的例子中,英偉達(一家投資重心在人工智能領域的晶片公司)的研究人員訓練了一個GAN模型,通過學習真實名人的圖像生成虛構名人的圖像。不像其他的機器學習方法那樣需要成千上萬的訓練圖像,GANs隻需要幾百張圖檔就能達到相當好的效果。

GAN的想象能力還很有限。譬如,一旦訓練了大量狗狗的圖檔,GAN模型就能夠生成一張相當真實的狗狗的圖檔,差别可能隻是狗狗身上的斑點有些許不同。但它不能生成一張全新動物的圖像。

原始訓練資料的品質對結果的影響仍然巨大。一個生動的例子是,GAN模型開始生成一些帶有随機字母的貓的圖檔。這是因為訓練資料中包含了來自網際網路的貓表情包,是以機器認為這些表情包上的字母是貓的一部分。

GAN之父Ian Goodfellow :那個賦予機器想象力的人類

華盛頓大學機器學習研究員Pedro Domingos說過,GANs的性能并不穩定。如果鑒别器太容易被欺騙,那麼生成器輸出的圖像将看上去不太真實。而校準這兩個互相對抗的神經網絡也是很困難的,這就解釋了為什麼GANs有時會生成一些奇怪的東西,比如有兩個頭的動物。

GAN之父Ian Goodfellow :那個賦予機器想象力的人類

然而,這些挑戰并沒有阻止研究人員。自從Goodfellow等人在2014年發表了關于他的發現的第一份報告之後,數百篇與GAN相關的論文陸續發表。GAN的一名粉絲甚至還建立了一個名為“GAN zoo”的網頁,專門用于追蹤已經開發出來的不同版本的GAN。

網頁連結(兩個網頁内容一緻):

https://deephunt.in/the-gan-zoo-79597dc8c347

https://github.com/hindupuravinash/the-gan-zoo

GAN最明顯的即時應用是在涉及大量圖像的領域,比如視訊遊戲和時尚領域(例如讓遊戲角色看起來像是在雨中奔跑)。但展望未來,Goodfellow認為GANs将會推動更大的進步。他說:“在科學和工程的很多領域都有一些東西需要優化。”例如藥物需要提高藥效以及電池需要提高效率等。“這将是下一個浪潮。”

在高能實體中,科學家們利用強大的計算機來模拟數百個亞原子粒子,在瑞士的CERN的大型強子對撞機這樣的機器中可能發生的互相作用。這類模拟需要大量的計算能力,非常緩慢。

耶魯大學和勞倫斯伯克利國家實驗室的研究人員開發了一種GAN,在對現有的模拟資料進行訓練後,它學會了對特定粒子的行為做出精确的預測,而且速度快得多。

GAN之父Ian Goodfellow :那個賦予機器想象力的人類

Goodfellow創造的GANs可以用來想象各種各樣的事物,包括新的室内設計。

醫學研究是另一個有潛力的領域。由于有隐私方面的擔憂,研究人員有時無法獲得足夠多的真實患者資料(進行研究),例如分析為什麼某種藥物不起作用。賓夕法尼亞大學的凱西格林說,GANs可以通過生成幾乎和真實情況一樣好的假記錄來幫助解決這個問題。這些資料可以得到更廣泛的分享,推進研究,而真正的記錄則受到嚴密保護。

Goodfellow vs Bad fellows 技術的黑暗面

然而,技術也有黑暗的一面。對于那些想要影響從股價到選舉等方方面面的人來說,一台可以制造假新聞的機器簡直是一個完美的武器。

人工智能工具已經用來在色情片的身體上放上其他人的臉,以及用政客的聲音說出自己想說的話。雖不是GANs制造這個問題,但是GANs的存在将會讓事情變得更糟。

Hany Farid在達特茅斯學院在學習數字驗證,他正在研究用更好的方法來識别假視訊,比如由呼吸引起的面部顔色的輕微變化,而這些變化GANs很難準确地模仿。但他警告說,GANs會反過來學習這些變化。Farid說:“從根本上來說,我們處于弱勢地位。

這種貓捉老鼠的遊戲也會對網絡安全産生影響。研究者已經強調了“黑匣子”攻擊的危險性,GANs被用于找出機器學習模型,因為許多安全程式都是用這些模型來識别惡意軟體的。

當搞清防禦模型算法的工作原理後,攻擊者就能避開防禦然後插入流氓代碼。同樣的方法也能用于逃避垃圾郵件過濾器等安全防禦措施。

Goodfellow很清楚這一危險。他現在上司一個谷歌的團隊,專注于讓機器學習變得更加安全。他警告說,人工智能社群必須吸取以往創新浪潮的教訓:技術人員總是在事後才開始考慮安全和隐私問題。

當他們意識到風險的時候,壞人已經有明顯的領先優勢了。他說,“很明顯,我們已經錯過了起點,但希望在落後太多之前,我們能在安全問題上取得重大進展。”

盡管如此,他認為不存在一個純粹的技術手段可以解決造假問題。相反,他認為,技術依賴于各種社會因素而進步,比如通過演講和辯論課等,教會孩子們批判性思維。

“在演講和辯論中,你會和另一個學生競争,你在考慮如何編造有利于自己甚至是誤導的說法,或者如何提出具有說服力的正确的主張。”他可能是對的,但他得出的“技術不能解決假新聞問題”的結論,并不是人們想要聽到的。”

原文釋出時間為:2018-03-11

本文作者:文摘菌

繼續閱讀