天天看點

這夢一般的街景,全是AI僞造的 | 把GAN秒成渣渣的paper+code比GAN更強現實,夢境關于陳啟峰相關連結

本文來自AI新媒體量子位(QbitAI)

這夢一般的街景,全是AI僞造的 | 把GAN秒成渣渣的paper+code比GAN更強現實,夢境關于陳啟峰相關連結

△ 『凡所有相,皆是虛妄』

上面這張德國街道圖檔,乍一看像是行車記錄儀拍的,又好像谷歌街景照片加了複古濾鏡。

實際上,這是一張合成圖檔。

在谷歌地圖上,根本找不到這樣的街道。一個神經網絡,根據自己在訓練過程中見過的真實街道,生成了它。

生成這張照片的算法出自英特爾實驗室的新論文Photographic Image Synthesis with Cascaded Refinement Networks,用級聯優化網絡生成照片。

在論文中,斯坦福大學博士陳啟峰和英特爾實驗室視覺組主管Vladlen Koltun展示了一種根據語義布局來合成照片的方法。所謂語義布局,就是像這樣,在圖檔上标出各種物體的位置:

這夢一般的街景,全是AI僞造的 | 把GAN秒成渣渣的paper+code比GAN更強現實,夢境關于陳啟峰相關連結

而他們的算法可以看作一個渲染引擎,輸入上面的圖檔,就相當于告訴它圖檔中間是道路、路上有車、上半部分有樹、有交通燈、右上有一些行人,然後按照圖上的布局,輸出一張逼真的照片。

陳啟峰在自己的部落格中說,“好比機器想象出來的畫面。”

經過3000張德國街道照片的訓練,遇到輸入的布局上标注成“car”的部分,這個見過很多車的算法就會自己生成一輛車,填在那裡。

現在一提到生成、或者合成圖像,可能大部分人都會立刻想到對抗生成網絡(GAN),不過,陳啟峰等的算法并沒有用到對抗式訓練,而隻用了一個端到端訓練過的前饋網絡。

和各種往往隻能生成小尺寸圖檔的GAN不同,他們提出的方法可以“無縫擴充”到高分辨率,1024×2014像素的圖像也能搞定。

當然,他們在論文裡也展示了自己的算法如何将各種基于GAN的生成模型秒成渣渣:

這夢一般的街景,全是AI僞造的 | 把GAN秒成渣渣的paper+code比GAN更強現實,夢境關于陳啟峰相關連結
這夢一般的街景,全是AI僞造的 | 把GAN秒成渣渣的paper+code比GAN更強現實,夢境關于陳啟峰相關連結

下面的視訊中,能更清楚的看到這個算法和pix2pix的對比:

這篇論文入選了今年10月在威尼斯舉辦的國際計算機視覺大會ICCV 2017,要進行口頭報告,相應的源代碼在GitHub上已經收獲了402個星,月初還登頂了GitHub熱門項目Python排行榜。

這夢一般的街景,全是AI僞造的 | 把GAN秒成渣渣的paper+code比GAN更強現實,夢境關于陳啟峰相關連結

康奈爾大學計算機系副教授Noah Snavely深受打動,他說,建立逼真的人工場景非常困難,即便是當今最好的方法也無法做到,而陳奇峰的系統生成出了他見過的最大、最詳細的人工場景。

他認為,這項技術可以讓人們描述一個世界,然後讓人工智能在虛拟現實中将其打造出來。“如果能夠僅憑大聲描述就能像魔法一樣召喚出逼真的場景,那就太好了。”他說。

陳啟峰認為,這種技術前途大好,最終可以用于創造真正模拟現實世界的遊戲場景。他說:“使用深度學習渲染視訊遊戲可能成為未來的趨勢。”現在,他已經開始嘗試利用這套算法來替換《俠盜獵車手5》裡的遊戲場景。

不過,他對這個系統還有一點不滿:合成的畫面不夠逼真。陳啟·峰表示,因為這套神經網絡渲染細節的能力還無法達到我們的預期,是以目前生成的圖檔比較模糊,有點像夢境。他正在開發一個更大的版本,希望能夠提升系統功能。

在這一點上,Snavely比作者還樂觀。他說,具體到建構虛拟現實場景,這種夢境般的效果未必是壞事,我們也不見得需要完全寫實的效果。

他更期待的,是讓這個系統能生成道路和室内布局之外的場景。Snavely說,要真正實作該系統的潛力,還是需要一套能夠真正捕捉現實世界多樣性的資料集。

但說起來容易做起來難,想用這個系統生成真是世界中的各種場景,需要借助大量的人力,對訓練中使用的圖檔進行詳細标記。

這篇論文的作者陳啟峰,經曆也頗為傳奇。陳啟峰生于1989年6月,成長于廣東省中山市。國小時,陳啟峰先後獲得全國作文競賽二等獎和奧數競賽一等獎。

2006年,17歲的陳啟峰發表論文,提出資料結構Size Balanced Tree(SBT)。2007年,陳啟峰在IOI上獲得金牌(第八名);2008年,陳啟峰以中學生身份獲得中山“十大傑出青年”稱号。

也是在2008年,陳啟峰放棄保送清華的資格,進入香港科技大學就讀,并獲得54萬港币全額獎學金。期間全部22門計算機課程都獲得A+。2010年,陳啟峰獲得百度之星程式設計大賽第三名。

2011年,陳啟峰在ACM國際大學生程式設計競賽獲得金牌(全球第二,北美冠軍)。同年還獲得香港大學生程式設計比賽冠軍。

2012年,斯坦福、哈佛、麻省理工、普林斯頓、加州大學伯克利分校、哥倫比亞、康奈爾、加州大學洛杉矶分校、密歇根大學安娜堡分校九所高校,同時以全額獎學金錄取陳啟峰攻讀研究所學生學位,最終他入讀斯坦福。

最後,放一張陳啟峰6月的博士畢業照。

這夢一般的街景,全是AI僞造的 | 把GAN秒成渣渣的paper+code比GAN更強現實,夢境關于陳啟峰相關連結

項目首頁:

http://cqf.io/ImageSynthesis

論文:

http://web.stanford.edu/~cqf/papers/Photographic_Image_Synthesis_ICCV2017.pdf

代碼:

https://github.com/CQFIO/PhotographicImageSynthesis

- 完 -

本文作者:李杉 李林

原文釋出時間:2017-08-15 

繼續閱讀