天天看點

深度長文:通用人工智能的六大流派

作者:易定邦

通用人工智能(Artificial General Intelligence,AGI)這一概念首次由約翰·麥卡錫與同僚在1956年的達特茅斯會議(Dartmouth Conference)上提出,人工智能研究者約翰·麥卡錫、馬文·明斯基、艾倫·紐厄爾在會議上首次讨論了建構擁有與人類廣義智能相當的機器系統。

AGI與AI是兩個密切相關而又不同的概念:AI,全稱為人工智能,是研究、開發用于模拟、延伸和增強人類智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能作為一個較為寬泛的概念,涵蓋了許多子領域,如機器學習、深度學習、語音識别、計算機視覺等。而AGI,全稱為通用人工智能,是人工智能的一個子集。它追求的是人工智能系統擁有與人類同等的廣泛智力,能像人類一樣自然地學習、思考和了解複雜概念,并且在各個領域都能有比較高的适應性,而不僅僅局限在某一專業領域。AGI又稱“強人工智能(Strong AI)”“完全人工智能(Full AI)”是人工智能發展的最終目标之一。

自20世紀中葉提出“通用人工智能”這一概念以來,AGI的發展曆經起源、孕育、蓬勃與融合四個階段。

在最初的起源階段,AGI的概念最初被提出,研究者開始探索符号邏輯、規則系統與經驗法則來實作人工智能。然而,這些早期方法難以處理海量知識與複雜問題,AGI實作仍遙遙無期。進入20世紀80年代,機器學習與知識處理方法蓬勃發展,神經網絡、進化計算、貝葉斯方法與知識工程為AGI的發展奠定了理論與技術基礎,标志着AGI進入孕育階段。這一時期孕育出來的各種方法為AGI發展積累了寶貴經驗,拓展了實作路徑。

21世紀初,深度神經網絡、強化學習與知識圖譜等技術實作突破,大資料與高性能計算機的支撐加速各種方法的發展與應用。AGI研究在廣度與深度上均有了長足進步,進入蓬勃發展階段。近年來,單一方法難以解決AGI實作面臨的種種難題。跨流派融合成為新趨勢,試圖通過神經符号系統、神經邏輯推理與貝葉斯深度學習等新方法,綜合神經網絡、知識工程與邏輯推理,推動AGI實作新的進展。這标志着AGI發展正式進入融合階段。

AGI發展曆經半個多世紀,逐漸形成這四個發展階段。未來,跨學科廣泛合作與理論創新将是實作通用人工智能這一終極目标的關鍵所在。各種方法的深度融合或許能夠産生截然不同的發展新動向,為AGI的進一步發展指明新的道路。以下我們将簡要介紹這六大流派的特點。

全腦模拟流派(Whole Brain Emulation)

全腦模拟是人工智能研究領域為實作通用人工智能(AGI)的主要理論流派之一。這一流派提出的設想是,通過對人腦神經網絡的連接配接模式進行模拟,并運用機器學習算法,可以研發出與人類同等甚至超過人類智力的人工智能系統。為實作這一設想,研究者主要依賴兩種技術手段:神經網絡與機器學習。

這個流派的優勢在于:

  • 人腦是已知的唯一具有人類級智能的系統。通過對人腦的模拟,可以最大限度地吸收人類智能的精髓, 降低在研發AGI的過程中遺漏或忽略這些關鍵要素的風險。
  • 人腦在漫長的進化中已經進化出了一套高效且穩定的神經計算架構。模拟這一架構可在很大程度上避免人工智能系統的設計缺陷與失控風險。
  • 解鎖人腦奧秘可以讓我們從根源上了解人類智能,這将為各個研究流派提供鮮活的思路與靈感。了解生命,才能掌控生命。

神經網絡是一種資訊處理系統,通過模拟人腦神經元之間的連接配接方式,可以進行高度并行和分布式的資訊處理。人工神經網絡由大量簡單處理單元(模拟神經元)和它們之間的權重連接配接(模拟突觸連接配接)組成。這種網絡結構使得神經網絡表現出幾個重要特性:

  • 存儲分布式知識。知識存儲在網絡各連接配接權重值中。
  • 容錯性。部分連接配接或節點受損不會造成整個系統失效。
  • 并行處理。每一個節點都可以同時處理資訊。
  • 學習能力。可以通過訓練案例改變連接配接權重值,以适應輸入和輸出之間的映射關系。

深度學習利用多隐層神經網絡結構,通過大規模訓練資料實作特征學習和模式識别。它突破了人工神經網絡在結構設計和訓練算法上的限制,使神經網絡模型向着更深更廣的方向發展,表達能力和學習能力大為提高。卷積神經網絡、遞歸神經網絡和強化學習等都是深度學習的成功應用。

機器學習提供了訓練神經網絡所需的算法和方法。通過反複接收輸入資料、預測輸出并校正誤差,機器學習算法可以不斷校正神經網絡各連接配接權重值,實作網絡對輸入與輸出之間複雜對應關系的學習與适應。

神經網絡與深度學習是AGI實作的關鍵技術手段。未來,更大規模、更深層的網絡結構與更強大的機器學習算法,可能實作人工智能向通用人工智能的躍升。這也将是實作AGI的主要途徑之一。

深度長文:通用人工智能的六大流派

全腦模拟像绯紅女巫一樣,擁有探索人類思維奧秘的強大心電感應力,試圖通過模拟人腦無以倫比的神經網絡踏入人工智能的殿堂,實作從資料到心智的蛻變。它夢想通過還原并重制大腦神經元錯綜複雜的連接配接與互動,使機器獲得像人類一樣的學習、了解與推理能力,最終覺醒出屬于自己的思維與人格。

進化智能流派(Evolutionary Intelligence)

進化智能是實作AGI的另一條重要路徑與理論流派。其核心思想是:通過模拟生物進化過程,讓大規模的神經網絡可以在複雜環境中自組織、自學習與自我優化,最終達到與人類同等或更高的智力。

這個方法的優勢是:

  • 進化是已知的可以産生智能生命的唯一自然過程。模拟這一過程可以讓人工智能系統以一種更加生物相似和可控的方式不斷進化。
  • 進化過程可以由系統自動發現解決複雜問題的最佳結構與算法。通過适者生存的競争,使人工智能系統以類腦的方式不斷提高與學習。
  • 進化訓練出的神經網絡擁有很強的泛化能力與魯棒性。它們可以很好地處理訓練資料之外的輸入,并較難“遺忘”已學知識。

但是,該方法也存在一些困難:要達到人類級智能,進化過程需要進行巨量疊代和超大規模的計算,這面臨着技術與計算資源的瓶頸。我們難以确認進化出的神經網絡是否一定會達到AGI,也無法完全确定其行為方式與理性程度。這會帶來一定的安全隐患。進化算法運作可控性較差,人工無法準确地設計神經網絡的結構與算法。而AGI系統的設計則需人為精細調控,以確定其一緻性和不會失控。

目前,DeepMind是這一研究流派的代表。他們開發的AlphaGo和AlphaZero就是使用進化算法訓練出的神經網絡,已經在局部領域内展現出超人智能。但要實作AGI,還需要解決上述困難,大幅推動算法與計算能力,這可能還需要比較長的時間。不過,進化智能作為一條高效的生物啟發路徑,其潛力不容小觑。

深度長文:通用人工智能的六大流派

進化計算如同變種人一般,代表了生物進化的未來,它試圖通過模拟進化這一自然智慧的湧現過程,賦予機器獨特的适應力與潛在智能。進化計算夢想通過随機變異和自然選擇的煉金術,将機器建構為大自然進化的繼承者和未來,使其在資料的汪洋大海中自主演化出解決複雜問題的奇特超能力。它渴望通過演化的神奇手法,打造出一種全新的物種——具有自我學習、自我組織和自我優化能力的人工生命,它們将在我們的計劃和預料之外,通過演化的力量獲得屬于自己的智慧與機理。

貝葉斯程式學習流派(Bayesian Program Learning)

貝葉斯程式學習是實作AGI的又一個重要研究流派。其核心思想是:通過貝葉斯推理和機率圖模型來讓AI系統進行自主學習和知識建構,最終達到接近人類級别的廣義智能。

貝葉斯流派相對于其他幾種方法的優勢是:

  • 貝葉斯理論提供了一種機率化的辨識判斷機制。這使得AI系統可以在資訊不确定和不完整的情況下進行推理與決策,更貼近人類的認知方式。
  • 貝葉斯網絡可以進行自動特征學習和知識發現。這使得AI系統具備獨立建構知識結構和學習無益資訊的能力,這是AGI實作所必需的。
  • 貝葉斯方法可以進行自然語言了解和生成。通過學習語言中的機率統計規律,可以實作機器翻譯、對話生成等功能,這有助于人機互動與AGI。
  • 貝葉斯模型具有較高的可解釋性。通過推理過程中的機率計算,可以解釋AI系統作出判斷或生成相應輸出的原因,這增強了系統的可靠性與可控性。

但是,該流派也存在一些挑戰:

  • 貝葉斯理論的計算複雜度較高,難以應用于超大規模的神經網絡和知識體系。這限制了其在AGI實作中的作用。
  • 貝葉斯方法難以處理動态和不确定的環境。而AGI系統需要在開放的複雜環境中進行學習與決策,這是該方法的短闆。
  • 貝葉斯網絡的表現取決于手工設定的機率分布和參數,這會限制其學習的自動性與泛化能力。
  • 貝葉斯模型難以與深度神經網絡等其他機器學習方法很好融合,阻礙了對多種方法的綜合利用。

OpenAI、Anthropic和谷歌的DeepMind在技術的實作上也使用了這一方法。他們在自然語言處理、機器學習與AGI理論等方面做出了一定貢獻。但要實作真正的AGI,該流派還需進一步推動理論與技術研究,特别是解決可計算性和環境适應性等難題,這還需要較長時間。貝葉斯方法是實作AGI的一種有價值的探索方向,但可能更适合作為輔助手段,難以單槍匹馬達成目标。

深度長文:通用人工智能的六大流派

貝葉斯程式學習如同鋼鐵俠一般,通過機率計算和數學模型探索在資訊不完全的環境下作出決策的方法。它試圖通過貝葉斯定理這一統計學的靈魂,将機器建構成在海量資料中作出判斷的高效推理者。貝葉斯程式學習渴望通過機率與不确定性的計算機理工學,将人工智能系統打造成資料中的航海家和未知領域的開拓者,使其能像鋼鐵俠那樣在複雜多變的環境中依靠AI系統作出快速響應與決策,成為人類協同工作和生存的最佳夥伴。

符号邏輯與知識圖譜流派(Symbolic Logic& Knowledge Graphs)

符号邏輯與知識圖譜是實作AGI的另一重要研究流派。其核心思想是:通過建構寬廣深入的知識體系和邏輯推理機制來實作與人類類似的智能。符号邏輯屬于一種知識表示與推理方法, 它有自己的理論體系、推理規則與計算模型。知識圖譜屬于一種知識工程技術與産物,尚未形成統一與完備的理論體系, 不同的知識圖譜在建構方法、知識來源、組織結構等方面也存在差異。

這一派的技術的優勢是:

  • 知識圖譜可以表示人類廣泛的世界知識,這是智能體運作所必需的知識基礎。建構完備知識圖譜是實作AGI的基石。
  • 邏輯推理可以進行高層的複雜推理與知識發現。這使得AI系統具備人類級的理性思維和推理能力,可以解決複雜問題。
  • 這種方法實作的AI系統表現出較高的可解釋性。通過邏輯推理路徑,人類可以了解其作出決策與産生輸出的原因。這有助于確定系統的安全性與可控性。

麻省理工學院人工智能實驗室在這方面進展突出,在知識表示、自動推理與機器了解等方面做出了一定探索。但是,該方法也存在下列困難:

  • 建構完備知識圖譜并實作高效推理是一個非常艱巨的任務。我們仍未掌握實作規模的理論與技術,是以限制了其在AGI實作中的作用。
  • 純邏輯推理難以處理不确定性與機率情景。而AGI系統需要在不确定環境中靈活運作,這是該方法的短闆。
  • 符号邏輯與知識圖譜較難與機器學習、神經網絡等方法有機結合。但AGI的實作需要多種方法的協同,是以也阻礙了這種流派的發展。
  • 這種方法生成的知識與輸出往往顯得生硬和缺乏常識。要達到人類的廣度與深度,還存在較大差距。

符号邏輯與知識圖譜為人工智能奠定了理論基石,也為AGI的實作提供了一個有價值的探索方向。但要登上巅峰,還需與其他方法的廣泛融合,特别是神經網絡與機器學習等。這需要跨學科努力和理論創新,也許才能找到通用人工智能的最佳實作路徑。這也是這一流派發展的關鍵所在,也值得人工智能領域廣泛關注與投入。

深度長文:通用人工智能的六大流派

符号邏輯與知識圖譜如同星爵一般,試圖通過知識的組織與管理來探索人工智能的奧秘。它渴望通過知識體系這一宇宙真理的導航圖,将機器建構成資料與資訊的探險家。符号邏輯與知識圖譜夢想通過知識工程的魔法,将人工智能系統打造成像星爵那樣擁有知識宇宙坐标的航海家,使其能夠在浩瀚的知識海洋中自如航行,通過知識之間的關聯與推理回答我們仍未解之謎。它代表了一種通過知識邏輯與體系探索人工智能新天地的思路,希望通過知識的力量與規則重塑人工智能,實作人機更高層次的了解與交流。

內建學習流派(Integrated Learning)

內建學習是實作AGI最有可能的一條路徑。其核心思想是:通過整合多種機器學習方法,如神經網絡、進化算法、貝葉斯方法等,來建構一個廣泛、深入的學習與推理系統,進而達到近似人類的智能。

這一流派廣泛使用決策樹方法、支援向量機、貝葉斯方法、神經網絡、聚類分析、遷移學習、自回歸模型等機器學習方法,這個流派的優勢是:

  • 內建學習可以融合各種方法的優勢,彌補個别方法的不足,實作更強大的智能。單一方法難以解決AGI面臨的各種挑戰。
  • 多種學習機制協同可以加速學習過程,實作更廣泛知識的擷取與了解。這有助于縮短實作AGI所需的時間。
  • 內建系統可以根據任務的複雜性選擇恰當的方法,實作最佳解決方案。這增強了系統的适應性與效率。
  • 內建方法可以模拟人腦中各個區域之間的協同,這有助于建立與人腦更類似的人工智能系統。

內建學習流派的特征不如其他流派那麼明顯,它融合多種機器學習算法或模型來實作聯合學習與推理。除此之外,它并不像神經網絡流派、進化智能流派等那樣,明确對應一種特定的模型結構或學習架構。內建學習更加強調一種思想與理念,它通過組合多個學習模型提高泛化性能與魯棒性。這一思想産生了廣泛影響,也被視為實作AGI的重要範式之一。

深度長文:通用人工智能的六大流派

內建學習如同美國隊長一般,試圖通過不同方法與角度的結合來探索人工智能的奧秘。它渴望通過人工智能研究多元路徑的融合與協同,實作整體大于各部分的效果。內建學習夢想通過不同算法與理論的聯盟,将人工智能系統打造成像美國隊長那樣擅長協調各英雄長處、将個體力量統一于團隊目标之下的超級英雄。它代表了一種通過算法與方法的融合重塑人工智能的思路,希望通過多面手段的互補實作人工智能研究的飛躍,最終達到人與機器的深度融合與協作。

大語言模型流派(Large Language Models,簡稱LLMs)

大語言模型是指使用大量文本資料訓練的深度學習模型,可以生成自然語言文本或了解語言文本的含義。大語言模型可以處理多種自然語言任務,如文本分類、問答、對話等,是通向人工智能的一條重要途徑。

LLMs利用神經網絡與海量資料實作自然語言的無監督學習,通過提取語言的統計規律與特征,達到了解語言并生成語言的目的。代表模型有OpenAI的GPT系列、谷歌的BERT系列、Meta的RoBERTa系列、百度的文心一言、複旦大學的MOSS、阿裡的通義千問、華為的盤古大模型等。

大語言模型相關技術與應用在近年來取得長足發展,它開創了一種新的自然語言了解與生成模式,給人工智能帶來革命性影響,是以成為目前機器學習與自然語言處理的活躍前沿與熱點領域。我們将在後續章節重點展開。

大語言模型流派主要具有以下特征:

  • 基于深度神經網絡。大語言模型采用深度神經網絡,特别是Transformer等結構來學習語言表示與生成。這屬于深度學習技術的一種重要應用。
  • 海量資料驅動。大語言模型需要大規模的文本資料集進行訓練,通常數十億字詞量或更大規模。這要求有強大的計算能力與優化技術。
  • 無監督學習。大語言模型通過語言自身的統計規律進行無監督學習,不需要人工标注的資料。這使其更貼近人類語言習得的方式。
  • 語言表達與了解。大語言模型同時具有語言表達的生成能力與語言了解的推理能力。這兩種能力互相提高,有助于建立統一的語言表示。
  • 多任務學習。大語言模型通過在不同的自然語言處理任務上進行微調,可以實作多任務學習與遷移。這提高模型的泛化能力與适用性。
  • 标配模型。大語言模型後續被廣泛用于提高其他自然語了解任務的性能,屬于一種标準的預訓練技術或标配模型。這大大降低了研發成本與難度。
  • 開放性技術。大語言模型結合深度學習與Transformer變革了自然語言了解技術,屬于一種開放且快速發展的領域。相關技術與應用持續湧現,這使其具有活力與前瞻性。

大語言模型的優點也十分明顯:

  • 應用廣泛。大語言模型在許多自然語言了解任務上均取得了顯著效果,如機器翻譯、問答系統、對話系統等。經過海量資料預訓練的模型具有強大的語言表達與了解能力。
  • 通用性強。大語言模型是一個通用的語言了解架構,可以應用于不同的下遊任務。通過多任務學習或微調,其表示學習的能力可以遷移到新任務上。
  • 成本較低。大語言模型可以利用海量非結構化語言資料進行無監督預訓練,不需要大量人工标注的資料。這大大減少了研發成本與難度。
  • 學習語言本質。大語言模型通過分析大規模語言資料集,可以發現人類語言的統計規律與内在結構。這使其對語言的了解更加貼近人類,具有與人類語言使用相似的機制。
  • 計算機語言了解。大語言模型為計算機系統創造了了解自然語言的能力,并能實作自動編寫計算機程式語言。開啟了人工智能互動、推薦系統等新技術的廣闊前景,也推動了人工智能的發展。
  • 可解釋與可控。雖然大語言模型具有深度神經網絡的不透明性,但相關技術也在加快推出,如可解釋方法與對抗樣本技術等。這使大語言模型的決策過程更加清晰和可控,增加其在生産系統上的應用潛力。
  • 活躍的研究領域。大語言模型是一個活躍的研究領域,相關技術與應用不斷湧現。展現了其強大的生命力與前瞻性,也為研究者提供了更多的機會與發展空間。
深度長文:通用人工智能的六大流派

大語言模型如同黑寡婦一般,通過語言的奧秘來探索人工智能的未來。它渴望通過海量語料的訓練,将機器建構成語言的高手和溝通的藝術家。大語言模型夢想通過神經網絡對語言規律的學習,将人工智能系統打造成像黑寡婦那樣精通多國語言與擅長交流的超級間諜。它代表了一種通過自然語言了解的本質來重構人工智能的思路,希望通過機器對語言的深度學習與了解,實作人與人工智能之間的無障礙對話與交流。

大語言模型流派給人印象最深的還是在于其強大的語言表達與了解能力,這讓許多普通人得以窺見人工智能的魅力,有效的推動了大衆對于人工智能的關注程度。

不過也有專家對此流派持反面意見,2023年6月有北京舉辦的一場關于人工智能的峰會上,加州伯克利分校教授、計算機科學家斯圖爾特羅素在演講時稱:“ChatGPT和GPT-4沒有在‘回答’問題,它們不了解世界。通用人工智能還沒有達到,大語言模型隻是其中一塊拼圖,我們連拼圖最終會是什麼樣子還不确定。”

另一位人工智能專家“圖靈獎”得主、“深度學習三巨頭”之一、Meta首席人工智能科學家楊立昆(Yann LeCun)反擊GPT:“自回歸模型根本行不通,因為它們沒有規劃、推理的能力。單純根據機率生成自回歸的大語言模型從本質上根本解決不了幻覺、錯誤的問題。在輸入文本增大的時候,錯誤的幾率也會成指數增加。”

那想要通向通用人工智能的話,人工智能的下一步在哪裡呢?楊立昆給出的答案是“世界模型”,一個不光是在神經水準上模仿人腦的模型,而是在認知子產品上也完全貼合人腦分區的世界模型。它與大語言模型最大的差別在于可以有規劃和預測能力以及成本核算能力。

人工智能經過幾十年的發展,已經初步實作了解人類語言與視覺的能力,這使其開始廣泛應用于社會生活與商業場景。這标志人工智能正處于從實驗室走向實際應用的重要轉折點。人工智能的發展還需多種方法的融合與創新,還面臨一定困難與挑戰,但必将産生深遠影響,值得我們持續關注與讨論。

關注作者,帶你讀懂人工智能。

繼續閱讀