天天看點

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

作者:第一條消息
AI 的「iPhone 時刻」已經到來

在剛結束的英偉達 GTC 2023 大會上,英偉達 CEO 黃仁勳把這個觀點反複說了 3 遍。

怎麼了解?

iPhone 搭載的多點觸摸螢幕技術開創了一個全新的智能手機界面互動模式,由此孕育了移動網際網路。

而 ChatGPT、Stable Diffusion 等 AI 超級應用的出現,标志着加速計算和 AI 技術的成熟已邁入成熟,AI 正以一個前所未有的速度滲入各行各業,推動一場新的産業革命。

經過近幾年 AI 技術的不斷發展,強大算力和先進模型為 AI 提供了合适的應用平台,促使各個廠商們重新構想自己的産品和商業模型,以及更新疊代的速度。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

昨天晚上,英偉達、微軟、Google、Adobe 等廠商在相差無幾的時間裡都推出了各自的 AI 服務,你追我趕之勢仿佛在傳達着同一個焦慮:

「在這個大 AI 時代,如果不想被人颠覆,就要先颠覆别人。」

AI 将會怎樣改變我們的生活?看過這「AIGC 最卷一夜」後,你或許能有更深的感觸。

英偉達正在把 AI 帶到各行各業

英偉達在一年一度的 GTC 大會上又帶來了很多讓人眼前一亮的「新活」。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

例如釋出了一項名為 CuLitho 的 AI 輔助制芯技術,為 2nm 制程鋪平了道路;與路特斯、奔馳、寶馬等汽車廠商合作,用 Omniverse 搭建數字生産線等。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

但要說到整場 GTC 大會最亮眼的内容,還得是英偉達釋出的新顯示卡——帶有雙 GPU NVLink 的 H100 NVL。

H100 NVL 是專門針對算力需求巨大的 ChatGPT 而設計的顯示卡,H100 NVL 擁有誇張的 188GB HBM3 記憶體(每張卡 94GB),這也是目前英偉達釋出的記憶體最大的顯示卡。

像 GPT 這樣的大語言模型非常占用記憶體資源,理論上參數達到上千億的 GPT 模型可以迅速占滿一張 H100 顯示卡。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

與用于 GPT-3 處理的 HGX A100 相比,使用了四對 H100 和雙 GPU NVLink 的标準伺服器的速度快了 10 倍,「核彈級」的 H100 NVL 是大規模部署像 ChatGPT 語言模型的理想選擇。

英偉達整的另一個大活就是把「ChatGPT 同款」搬到了雲上,向公衆開放。

ChatGPT 的運作主要依靠由 A100 或 H100 組成的 DGX 超級計算機,微軟為此花了數億美金采購了上萬張 A100 顯示卡組建 Azure 雲計算平台。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

為了降低使用者部署大模型的成本,英偉達推出了 DXG Cloud 服務,每個月 36999 美元起,你就能獲得一個由 8 張 H100 或 A100 顯示卡組成的雲端超級計算機,輕松完成高負載的計算工作。

2016 年,老黃親手向 OpenAI 傳遞了第一台 DGX 超級計算機電腦。7 年之後,頂尖的 AI 算力通過 DXG Cloud 有機會走進每家公司,完成在過去不可能完成的任務。

不難想象,像 ChatGPT 這樣能夠改善人類交流、提高工作效率的先進應用會持續湧現,為我們的生活帶來更多的便利和驚喜。

點石成金,二代 Runway 讓你一句話生成各式大片

B 站一直流行一句梗:視訊不能 P,是以這是真的。但如今視訊不僅可以 P,還可以從無到有直接用 AI 生成,不用畫師、不用攝影、不用後期。隻要你往 Runway 中輸入一段文字,它便還你一段震撼人心的短片。

最早,Runway 是一款後期輔助工具,雖然借助了人工智能的神奇力量,但所能實作的,并不複雜:擦除物體、圖像插幀、删除背景、運動追蹤等,可以将它視作 Adobe Premiere 的傻瓜式插件。

而當 Runway 打開人工智能的新大門後,它擁有了點石成金的能力。在去年 9 月公布的 Gen 1 版本中,它有了文本轉視訊的能力。那時的人們,剛剛見識過文本轉圖像的魔力,而 Runway 直接能生成動态影像,簡直是降維打擊般的震撼。

時隔半年,Runway Gen 2 來了。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

比起 Gen 1 模型,它實作了更高的時間一緻性和保真度,說人話就是畫面之間的聯接得更順暢了,畫質還更高清了。

用上 Gen 2,距離随時随地生成自己想象的視訊更近了。

輸入一條不算長的提示詞:無人機航拍的山脈。據此 Runway 生成出以下畫面。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

再來一個:午後陽光照進紐約市中一幢較高價的電梯大廈的窗戶。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

來個進階版,給 Runway 喂進圖檔和文字,進而生成一段短片。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

▲ 文字為:一個男人走在街上,周圍酒吧的霓虹燈照亮了他

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

▲ 原圖

或者是讓一幅靜态圖檔動起來。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

還可以将一張無紋理待渲染動圖,直接渲染出動态影像。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

Runway 的進步有目共睹,在對抗網絡模型路上越走越遠、越走越順,如今的 Gen 2 版本已經算是「可看」的程度,雖稱不上精緻,但未來可期。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

或許到了 Gen 3 版本,我們就能在它的幫助下,一鍵生成抖音爆款短片。到時候,這會是優質部落客的噩夢嗎?

突發!Google 開啟 Bard 測試

如果說英偉達讓我們看到了 AI 發展的未來,那 Google 的 Bard 就是 AI 的今天。

在大家被 GPT-4 和 Midjourney V5 震撼刷屏一周後、老黃展望未來 AI 時代的同時,Google 宣布正式開放 Bard 的通路:請嘗試 Bard,并提供你的回報。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

根據 Google 的最新示範,相比 ChatGPT,Bard 更像是一個專注于工作學習的随身助理,你可以在它的協助下,激發想法、滿足好奇心。

你可以讓 Bard 用簡單的語言解釋量子實體學,或者讓它提供頭腦風暴,幫你在一年内閱讀 20 本書。

Google 表示,使用者可以在 Bard 的協助下,加速想法、激發好奇心。你可以使用 Bard 提供一些技巧,比如如何實作一年閱讀 20 本書,或者用簡單的語言解釋量子實體學。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

在示範中内容中我們還發現了一些細節,Bard 似乎會同時生成多個回答,你可以根據需求選擇最适合你的那一個,并進行持續提問。

當然,ChatGPT 也可以生成多個回答,但它是在回答結束後重新生成,相較來看,Bard 更像是一個會同時提供多種方案的乙方。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

可能是 ChatGPT 和 Bing Chat 的負面消息引起了 Google 的重視,後者不斷強調 Bard 隻是一場實驗,Bard 生成的資訊并不代表 Google 的觀點。

Google 表示,雖然 Bard 由大型語言模型提供支援,并會随着時間推移而日漸強大,但它會學習到一些偏見或者刻闆印象,導緻它「自信滿滿」地說出一些不準确或者虛假的資訊,比如它會将「ZZ Plant」了解為 Zamioculcas zamioculcas,而不是正确的 Zamioculcas zamiifolia。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

有了 Bing Chat「瘋了」的前車之鑒,Bard 的第一個測試版就限制了同一對話中的交流次數,進而保證内容的準确。當你第一次登陸 Bard 時,它就會告訴你這隻是一個實驗,并期待你的回報。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

作為 Bard 的第一個版本,它暫時還不支援更多語言(包括中文),Google 會持續更新寫代碼、識别/生成圖檔以及多語言支援。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

▲ Bard:我不會中文,但希望未來會說

目前,Bard 僅在英國、美國開放通路權限,未來會逐漸擴充到更多國家和地區。

聊天就能做圖,Bing Chat 更進一步

Bing Chat 到底有多火,或許隻有上線一個月就讓 Bing 日活首次突破 1 億的資料能說明了。從複雜問題到娛樂聊天,再到靈感創意的實作,Bing Chat 正在重塑我們網絡搜尋的體驗。

現在起,你可以讓 Bing Chat 畫圖了。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

微軟為新 Bing 和 Edge 浏覽器的預覽版更新了三個新功能:Bing Image Creator、人工智能驅動的 Stories 以及 Knowledge Cards 2.0。其中最重要的當屬可以畫畫的 Bing Image Creator。

微軟表示,人腦處理視覺資訊的速度比文本快約 6 萬倍,Bing 的搜尋資料中,圖像是搜尋最多的類型之一,而由 DALL·E 模型的進階版本提供支援的 Bing Image Creator,可以讓我們通用自己的語言在 Bing Chat 中描述圖檔資訊、選擇藝術風格,Image Creator 就會聯系上下文,将你的想象「畫在紙上」。

Bing Image Creator 的加入,讓 Edge 浏覽器變成了第一個內建人工智能圖像生成器的浏覽器。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

由人工智能驅動的 Stories 和 Knowledge Cards 2.0,可以讓你在搜尋後獲得圖像、短視訊以及由人工智能驅動的資訊圖表,可以一目了然的擷取事實和關鍵資訊。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

未來使用 Bing 搜尋時,你獲得的就不是一個個冷冰冰的網頁連結,而是更加豐富、有趣的圖檔、視訊以及視覺故事。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

如果你已經通過新 Bing 申請,現在就可以在 Bing Chat 中體驗 Bing Image Creator 了,如果從以下網址進去的話,則可以直接試用。

https://www.bing.com/create

不過這一功能暫隻支援英文,未來會持續更新。

Adobe Firefly:「友軍中的最強輔助」

當科技公司卷到圖檔生成後,著名設計創意公司 Adobe 自然不甘人後。在這個瘋狂的夜晚,Adobe 也推出了自己的創意生成式 AI 模型集:Adobe Firefly。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

Adobe 用幾個簡單的例子展示了 Firefly 的能力。你可以用一句話,讓正處于春天的風景,變成冬天的模樣。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

你也可以在草地上用筆刷随意刷一下,然後告訴 Firefly 這是一條河,它就會自動生成河流。

最卷一夜!谷歌ChatGPT開放、英偉達投下核彈顯示卡……AI又變天了

Firefly 能做的自然不隻這些,框選狗狗的毛發,它可以将毛發變成畫筆,現場幫狗狗改變發型;設計一個藝術字,它能幫你生成一個單詞、一句話;設計好一款耳機,Firefly 還能把它放到場景中,變成産品展示圖……

Adobe 認為,AI 正在提供一種打開世界的新方式,設計師可以用最順手的方式來實作創意,「幫助創意人而不是取代創意人」。

同時,Adobe 還創立了「内容真實性倡議」CAI,建立了可信數字内容歸屬的全球标準,并對人工智能生成的内容進行标記,打造 Firefly 生态系統,「Adobe Firefly 是友軍,更是友軍裡的最強輔助」。

進擊的 AIGC

這一夜裡,我們見證了 AI 領域從服務層到應用層的幾個大突破。

這些紮堆出現的更新從側面證明了,AI 領域邁進了一個高速發展的階段。上一個月 AI 可能還畫不好手指,下一個月憑借算力提升和模型更新,AI 已經能取代掉服裝模特的工作。

無數的科幻作品都預言過 AI 在未來會成為我們生活的一部份,但沒有人告訴過我們,我們離這個未來隻有咫尺之遙。

我們的生活正在被 AI 一點點地改寫。在 GTC 大會上,黃仁勳提出了一個很有意思觀點,他認為生成式 AI 就是一種新型的計算機,我們可以用人類語言進行程式設計,任何人都可以指令計算機來解決問題。

過去的幾個月裡,我們見證了 AI 是如何逐漸掌握畫畫、寫作、剪輯、制表、做 PPT 等技能,按照這個進化速度發展下去,還有什麼是 AI 不能做的嗎?

OpenAI 的 CEO Sam Altman 最近在 Twitter 上大膽預測了新版「摩爾定律」,他認為全球人工智能運算量每隔 18 個月就會翻一番。

也就是說,如果你對生成式 AI 還留有質疑,那麼時間會給你最有力的答案。