天天看點

大模型的湧現能力,真的隻是黃粱一夢?

作者:老陽的奇妙電波
大模型的湧現能力,真的隻是黃粱一夢?

GPT-4太強,OpenAI也不懂!人工智能到底是怎麼突然「湧現」的?

這是目前用于區分AI大模型和非大模型能力的标準之一。它似乎在告訴我們,人類通往AIGC,即通用人工智能時代的隧道已經設計完成,僅需靜待有限的"施工建設時間",人類便可踏入人機共存時代。

那究竟什麼是人工智能的「湧現」?

湧現現象的經典含義是指,在一個複雜系統中,組成該系統基本元素之間互相作用,産生了全新的、宏觀的性質或行為。這個定義非常抽象,我們舉個例子來了解。單隻螞蟻在自然環境中行動,它隻會尋找食物和避開危險,但是當大量螞蟻一起行動時,它們能夠建造出非常複雜的蟻穴。這些蟻穴甚至有特定的通風和溫度控制系統,但每隻螞蟻并不知道整個蟻穴的設計,他們沒有預先規劃好的圖紙,卻能完成這樣的大型工程,這就是典型的湧現現象。

大模型的湧現能力,真的隻是黃粱一夢?

人工智能模型中,湧現現象也并非剛剛出現。如今最先進的人工智能模型被稱為神經網絡,因為它和人腦非常像,都是海量神經元互相連接配接而成。

大模型的湧現能力,真的隻是黃粱一夢?

無論神經網絡還是人腦,它們内部的神經元大多都非常相似,甚至于一模一樣。但是,哪怕一樣的神經元,一旦處在不同的位置,就會自動承擔不同的功能,發揮不同的作用。

是以,神經網絡中簡單神經元的大量重複,就可以實作如今AI各種各樣的複雜應用,這就是一個典型的湧現現象。

大模型的湧現能力,真的隻是黃粱一夢?

雖然我們在神經網絡中了解到了湧現現象,但随着超大規模AI模型GPT 4.0 的問世,我們所有人還是迎來了當頭一棒,就像是看見了傳統實體學的兩朵烏雲散開一樣。

GPT 4.0中智能的湧現開始顯現出一種颠覆所有規則的了解難度,這種湧現遠遠超過了從局部到整體能力轉化這個意義,而是表現為各方面綜合能力的爆發式增長。雖然湧現現象的本質早就被諾貝爾實體學獎得主、凝聚态實體泰鬥P.W. Anderson精辟地總結為"More Is Different"

但GPT4給我們帶來的震撼過于龐大,以至于我們在大模型中,對湧現現象的具體定義修改為:在小模型中沒有的能力,卻在大模型中突然出現的現象。定義中所謂的“小模型”,已經是大模型出現前人類世界AI發展的皇冠,代表了有史以來最先進的矽基智能能力。

注意:我們剛剛所說的”突然出現“,這意味着湧現現象的第二層含義:我們無法确定湧現的發生點!

我們可以很明确地觀測到,一旦模型大小超過某一個門檻值,模型就像修煉突破了一樣,展現出前所未有的能力。但同時,這個門檻值卻無法預測!我們無法确定模型什麼時候能完成下一境界的突破。

這個特性也給大模型蒙上了一層神秘的面紗,并且給了我們無限的遐想空間。是否大模型有朝一日可以突然突破,一步躍進成為AGI。是以盡管GPT 4.0仍有許多缺陷,比如技術報告中提到的不完全可靠(胡編亂造,也被稱為幻覺hallucinations)、有文本長度限制以及不能從經驗裡學習

大模型的湧現能力,真的隻是黃粱一夢?

但許多人開始相信,GPT 4.0中的湧現現象已經為通往AGI指明了确切的道路。微軟的研究報告中甚至認為,GPT 4.0已經可以被視為AGI的早期版本。

同時許多人也開始擔心AI安全問題,比如大模型突然獲得不受控的意識和想法,這在AI自我進化之路開啟之後是非常有可能的。那随着我們不斷地利用大模型來解決問題,将他們部署到世界各處,就像是在全世界都埋上了不定時炸彈一樣。

是以,目前已有兩萬七千多人在暫停巨型AI實驗的公開信上簽字,其中不乏馬斯克、Bengio等著名大佬,公開信中對目前AI的安全性發出了一連串的質問。

大模型的湧現能力,真的隻是黃粱一夢?

不管是對AI的美好暢想還是合理擔憂,就在大多數人都沉浸于想象未來時,一篇論文企圖将大家從烏托邦拉回現實:大模型中的湧現現象或許并不存在!

斯坦福的研究小組認為,目前大模型任務的評價标準本身就是非線性的,由此才會導緻所謂的湧現現象!

比如在Google提出的大模型評測基準BIG-Bench (Beyond the Imitation Game)中,超過92%的評測标準都包含下面兩條定義之一,第一條意味着我們對選項進行機率輸出,如果最大機率的選項就是正确選項,則記1分,否則其餘情況都記0分。第二條和第一條類似,我們對比模型輸出的一句話,如果和目标完全符合,才記1分,否則也都記0分。

為了幫助大家直覺了解,我這裡舉一個例子。想象一下一個水滴和一場洪水。一滴水在地上幾乎沒有影響,但是當這些水滴彙聚成洪水時,它們可以沖毀房屋,破壞土地,甚至威脅到人的生命。如果我們以檢測洪水為最終目的,顯然就是非線性的評測标準。

大模型的湧現能力,真的隻是黃粱一夢?

為了驗證猜想,研究小組将評測标準進行了拆解細化,也就是水量大一點就加一點分數,而不是洪水泛濫才記1分,此時模型的能力和所需運算力呈現出了近乎線性的正相關關系!

大模型的湧現能力,真的隻是黃粱一夢?

這無疑打破了許多人對于湧現能力的設想,期望着湧現能力能夠帶給我們意料之外的智能,似乎也成為了天方夜譚。但當我們回頭評估這篇論文的實際意義時,可以自然地提出一個問題:人類對于智能的定義也是非線性的嗎?

顯然是的!首先,智能的定義本身就不是一個客觀概念,現有的概念往往都是針對某一特殊領域的研究得到。

大模型的湧現能力,真的隻是黃粱一夢?

其次,在現代研究中,我們發現動物的社會智能與人類的相似,例如猴子會進行欺騙,海豚會照顧受傷的群體成員(展示出同情心),甚至魚也表現出微妙的社交技能。這些研究促使我們重新考慮智能的定義,并擴大我們對智能的了解。連結

綜上所述,我們目前對于大模型湧現能力的認知,确實可能有一定的偏差,這個偏差會随着科學的探索不斷糾正。但是,一個概念的定義,會影響人類對于AI的發展道路嗎?我想是不會的。大模型的湧現能力不管如何去定義,都不會改變大模型本身的能力,也不會減緩我們将大模型應用落地的步伐。工程應用往往都有一個非常顯著的特點,叫子產品化與解耦合。

大模型的湧現能力,真的隻是黃粱一夢?

上層從不會去在意下層是怎麼實作的,不管下層變得是什麼戲法,上層都是将下層視為功能子產品,而工程師的工作,就是不斷地去組合這些功能子產品,去逼近這些功能子產品的極限能力,想盡辦法利用現有的技術,解決現實中的問題。

大模型的湧現能力,真的隻是黃粱一夢?

如今大模型對了解、應用我們的世界規則有了質的提升,那相對應,随之而來的應用更新也一定會有質的飛躍!

或許,我們離想象中的AGI還有一定的距離,我們賦予了AGI太多的拟人化形象。

大模型的湧現能力,真的隻是黃粱一夢?

然而,想象一下,當我們站在AI的巨人肩膀上,讓它協助我們的日常工作生活,讓它賦予我們解決困難挑戰的力量。再或者說,當它開始預見我們的需求,當它的存在變得像空氣一樣普遍。那麼所謂的AGI,不過也就演變成一個概念的定義罷了。