天天看點

AI模型|Midjourney,想象力的引擎,人工智能圖像生成器的崛起

作者:數字時代學習羅盤

每天一個AI模型,讓思維提前和未來同步。

AI模型|Midjourney,想象力的引擎,人工智能圖像生成器的崛起

一個機器蒸汽機,以驚人的速度沿着軌道疾駛,噴出五顔六色的煙霧雲

AI生成的藝術作品正在悄然開始重塑文化。在過去的幾年裡,機器學習系統從文本提示生成圖像的能力在品質、準确性和表達方面有了顯著提高。誕生了DALL-E,Midjourney,Stable Diffusion等幾個頂級圖像生成AI。

建立這些藝術感濃烈的圖檔不僅棘手,而且代價不菲。AI需要通路數百萬張用于訓練系統的圖像,并且進行大量的計算工作來生成模型參數。

今天介紹的Midjourney,差別于其他幾個生成AI的最主要特點是他的與大衆相聯通的方式,通過Disscord——一個由興趣而聚集在一起的社群。

在一個廣場,完全開放浏覽

之前介紹的DALL-E,Stable Diffusion都是類似于一個單機的程式,不論是你在官網Demo上體驗,還是你通過複制源碼使用自己的計算資源來生成,你在創造一個新事物的時候,是無法和其他人形成溝通的。正如Midjourney創始人David Holz在接受Verge采訪的時候說:

“很多人問我們,你為什麼不做一個 iOS 應用程式,讓你拍一張照片?”

“但人們想要一起創造事物,如果你在 iOS 上這樣做,你就必須建立自己的社交網絡。 這很難。 是以如果你想要自己的社交體驗,Discord 真的很棒。”

那Discord是什麼呢,Discord是一款專為社群設計的免費網絡實時通話軟體與數字發行平台,主要針對遊戲玩家、教育人士、朋友及商業人士,使用者之間可以在軟體的聊天頻道通過消息、圖檔、視訊和音頻進行交流。

Discord就像是一個容納了無數興趣廣場的地方,進入廣場的人首先都是被某個招牌,也就是某個興趣點吸引而來的人。

于是,你利用Midjourney創作的内容,會實時的展現給廣場裡所有的人。我認為這種公開的方式,也促使了人們展現自己善良一面的創造力。

AI模型|Midjourney,想象力的引擎,人工智能圖像生成器的崛起

加入Discord頻道,隻需要輸入提示詞,等待一會機會出現AI生成圖檔,并且是公開的

在加入Discord頻道後,每時每刻都會有很多奇思妙想式的圖檔被創造出來

AI模型|Midjourney,想象力的引擎,人工智能圖像生成器的崛起

電影海報,皮克斯風格,mônica和朋友,可愛,海報皮克斯,3D

AI模型|Midjourney,想象力的引擎,人工智能圖像生成器的崛起

關于twitch 直播間的漂亮的網站界面

完全開放的廣場,不僅促進了人們更“友好”的進行交流,并且也提供了大量的靈感觸發。

機器的想象力會超過人類嗎?

關于想象力,似乎在具象想象力這個方面,AI走在了我們的前面。但是——我們如何擴充人類的想象力? 那是什麼意思? 當計算機比 99% 的人類更善于視覺想象時,這意味着什麼?

這并不意味着我們将停止想象。 汽車比人類快,但這并不意味着我們停止步行。 當我們遠距離運輸大量物品時,我們需要發動機,無論是飛機、輪船還是汽車。 我們将這項技術視為想象力的引擎。 是以這是一件非常積極和人性化的事情。

是以現在很多的實驗室和公司都在研究文本轉化為圖像的技術,Google 有 Imagen,OpenAI 有 DALL-E,還有一些像 Craiyon 這樣的小項目。那麼研究這個技術有什麼用呢?

我有一個非常大的想象:在未來的某一個天,你買回一個帶有進階AI處理器的Xbox,你不僅僅可以玩那些遊戲廠商提前建立好的遊戲,你可以自己想象你的遊戲世界,然後根據的想象文本,AI快速幫你生成遊戲空間,聽起來簡直太酷,好像在這一刻,你就是造物主一樣。

下面這幅圖就是在Midjourney上,使用提示詞——詳細的、技術圖紙、展示了、革命性的、“想象力引擎”——生成的圖檔。

AI模型|Midjourney,想象力的引擎,人工智能圖像生成器的崛起

關于生成想象的機器的想象,看起來既複古又有未來感

想象力的提升,需要群體的智慧

我們很快發現大多數人不知道他們想要什麼。

你說:“這是一台你可以想象任何東西的機器——你想要什麼?”

他們說:“狗。”

你說:“真的嗎?”

他們變成了說:“粉紅色的狗”。

是以你給他們一張狗的照片,他們會說“好”,然後去做其他事情。

然而,如果你把他們放在一個組裡,情況會發生本質的提升。

他們依然會說:“狗”,但是!

其他人會變成:“太空狗”

還有其他人會變成說:“阿茲台克太空狗”。

然後突然之間,人們明白了各種可能性,而你正在創造這種增強的想象力——一個人們可以利用這種新能力學習和玩耍的環境。 是以人們真的很喜歡一起想象。

這也是為什麼Midjourney制作了Discord,而且是巨大的,智能化的Discord社群來供人們想象。

AI生成圖檔前,所需要的訓練資料來自于哪裡呢?

其實這個問題,困惑了我很久,明顯AI生成的圖檔有些具有非常強烈的藝術風格,并且不同模型根據相同提示詞生成的圖檔也具有某種意義上的關聯性(如果你的審美具有基本水準,我相信誰的可以發現)

後來發現,原來幾乎所有的AI生成式模型使用的訓練資料幾乎都來自于網際網路——這也是為什麼Stable Diffusion等會面臨被藝術家起訴的境地——因為AI未經授權,擅自使用了别人的作品。

當然,這也是AI生成的早期階段,這就好像是這麼多家公司,都使用的同一個檔案夾裡的圖檔——一個巨大的圖檔庫。

但是,現在很多AI都面臨的一個問題就是,通過網際網路學習的AI會産生一些偏見,比如你讓他畫一個CEO,這個CEO通常是白人,而你讓他畫一個護士,這個護士總是一個女性,并且很大機率是有色人種。并且像Midjourney早期就非常喜歡使用藍色和黃色色調。

最後一個思考,AI危險嗎?

我覺得人們完全誤解了人工智能是什麼?有些鼓吹AI威脅論的人認為AI是一隻老虎。老虎是很危險的,因為老虎可能會吃掉人。這是一個你死我亡的過程。

但是AI更有可能是水,水很危險,人可能會淹死在水中,但是流動的水的危險和老虎展現的危險不是同一個東西,我們可以在水中遊泳,甚至可以造船,修建水電站,讓水成為一種驅動力。

就像古話說的,水善利萬物而不争,隻要我們知道如何與水和平共處,我們會從中獲益。

我認為這是一個機會,水沒有意志,我們應該做好引導工作,而不是貿然行動淹死在裡面。

最後,讓Midjourney為我們生成一幅圖,AI心目中,如何将人工智能描繪成水。

AI模型|Midjourney,想象力的引擎,人工智能圖像生成器的崛起

有點類似神靈從水中躍出

繼續閱讀