天天看點

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

在這篇文章的開頭,世超先來給大家看一張圖檔。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

還有這張。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

以及這張。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

當然,給大家看這幾張風景照是有原因的,因為這些圖檔完全由 AI 技術生成,是假的。。。

其實世超已經對各種 AI 技術快要聽膩了,但是這個自動生成圖檔的技術确實能讓人眼前一亮。

這些圖檔不僅看上去跟真的照片一樣,而且是根據你的想法進行創作的。

隻要你在上面随便畫兩筆,而就是這再簡單不過的幾筆,AI 就可以在你極其簡單的創作基礎上添加 “ 億點點 ” 細節。。。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

簡直離天下之大譜。。。

而這個黑科技一般的玩意兒,出自我們熟悉的英偉達之手,這是一個叫做PoE GAN的 AI 技術。

這裡的 PoE 指的是 Product of Experts,專家乘積,而 GAN 就是生成對抗網絡的意思。

是不是聽不懂?沒關系我也聽不懂。。。

但大家不需要知道具體的意思,隻要知道 PoE GAN 是一種究極縫合怪,它既能識别出你的靈魂繪畫,也能根據文字輸入生成畫面。

隻要在上面随便畫兩筆,它就會立刻響應并生成對應的畫面。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

你加多少,它就生成多少,分毫不差。

無論怎麼群魔亂舞,AI 都能從容不迫地應對過來。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

你也不用去管裡面的細節,AI 會自動識别不同的區域,比如波浪形狀的就是山峰,圖檔頂部就是天空等等。

要是你不喜歡現在的樣子,還可以改變地形和天氣,想要啥樣的都能給你整出來。

你還可以直接敲字,AI 就會實時分析出來再把文字轉化成圖像。

比如打出山峰被雪覆寫,畫面就會從山峰變成覆寫了積雪的山。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

或者打出沙灘,畫面會立刻出現對應的景象。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

但是你後面接着打出多雲,天空就會跟着發生變化。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

世超第一次看确實覺得很驚喜,但是看多了這種示範,難免也會對這項技術産生一些疑問。

比如,PoE GAN 是不是隻是單純地把已經學習到的素材進行拼接,才産生出了這些圖檔?

還真不是這樣,PoE GAN 不止會把大片的樹木、山脈、天空和海洋拼接在一起,還會按照你畫出來的細節進行填充。

比如示範中畫出來的一小塊謎之物體就會被 AI 識别出來,并生成了海洋中的一塊石頭。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

不僅識别成功,畫面中的細節也遵循了現實生活的邏輯,比如石頭周圍就會有海浪産生,海水也是白色的。

這個細節,有點東西。

不過為了能夠對這玩意兒了解更深一點,世超還是去網上查到了英偉達官方的資料和說明,想看看具體的解釋。

目前現有的圖像合成架構裡,遇到單一類型的需求是沒問題的,但要是各種不同的需求一起上,那 AI 就當場懵逼了。。。

而 PoE GAN 的誕生就是為了解決這一限制,它可以識别不同的輸入,并把它們混合在一起。

比如這裡有一個非常直覺的例子,當你隻選擇簡筆畫的時候,畫面會按照目前的需求生成一幅圖像。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

這時我再加上不同的顔色和文字,把不同的區域分隔開來,畫面就會按照需求變成另外一副模樣。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

而當把詳細的文字描述也勾選上,此時圖像就會在按照要求已經生成的圖像基礎上,進一步滿足人們苛刻的要求。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

PoE GAN 确實很神奇,但這項技術也不是最近才出現的,英偉達在 2019 年就搞出來了一個 AI 技術,叫做GauGAN。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

名字聽上去有點怪,但這項技術确實能夠讓人們以低到不能再低的門檻,來讓 AI 生成一幅以假亂真的圖檔。

後來 GauGAN 進化出了 GauGAN2,同時它帶來了一個新的玩法,那就是打字畫畫。

隻要你在文本框上面瘋狂敲鍵盤, AI 就會根據文字自動生成對應的畫面。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

再往後就是前面提到的縫合怪 PoE GAN 了,這玩意兒進化的速度還真夠快的。。。

總的來講,英偉達的這個新技術确實非常黑科技,随便打打字就能生成一張以假亂真的圖檔,這要是放在幾年前,估計所有人都覺得是在扯淡。

結果在開發人員一通搗鼓之後,還真把這種看着像魔法一樣的畫面給變成現實了。

以前需要找一張風景照片,要麼去版權網站上面找一張,要麼自己出門拍一張。

而現在隻要讓 AI 生成一下就可以了,就算在炎熱的夏天也可以輕松搞到一幅雪天美景。

編段話就能變出一張圖檔,英偉達不賣顯示卡改賣藝了?

而這個過程,基本不會花費任何力氣。

世超估計看到這個技術的繪畫、遊戲和相關從業人員都高興得夠嗆,終于不用再累死累活設計背景了。。。

但是評論區也有攝影師表示擔憂,以後人們不用再出門就可以制作出美景了。

無論如何,這項技術确實讓不少人大開眼界,也讓世超更加期待未來的創作過程會産生怎樣的革新了。

撰文:百威編輯:面線

圖檔、資料來源:

YouTube - Two Minute Papers

NVIDIA Corporation - Multimodal Conditional Image Synthesis with Product-of-Experts GANs

cnBeta - 英偉達最新 AI 技術可将文字轉化為逼真的圖像

繼續閱讀