2022 年 11 月 24 日,李德毅院士在北京資訊科學與技術國家研究中心的邀請下,發表了題為
「疊代的智能——從薛定谔、圖靈和維納談開去」
的報告。報告從認知實體學的角度,讨論機器如何依靠負熵維持生命,像人一樣認知。站在薛定谔、圖靈、維納等科學巨人的肩上,讓智能機器接收指導學習和自主學習,解釋解決在現實世界中遇到的新問題,可互動、會學習、自成長,将越來越多的未知變為已知。
李德毅,中國工程院院士、歐亞科學院院士。中國人工智能學會理事長,中國指揮與控制學會名譽理事長,中國雲計算專家委員會主任,清華大學、國防大學兼職教授,博士生導師。長期從事計算機工程、不确定性人工智能、大資料和智能駕駛領域研究。
19 世紀末到 20 世紀中葉,人類的科學技術取得了許多重大突破,出現了許多偉大的科學家。其中,控制論之父維納(1894年-1964年)、量子力學之父薛定谔(1887年-1961年)和人工智能之父圖靈(1912年-1954年)為人工智能研究者留下了許多傳世名作。如今,再讀他們的五篇經典論文,可以為我們帶來一些新的啟發:
(1)在論文「On computable numbers with an application to the Entscheldungs problems」(1936)中,圖靈提出了「圖靈機」,奠定了其「計算機之父」的地位。在這篇論文中,圖靈指出,圖靈可計算和一般遞歸函數等價,通過暴力計算可以逼近無限。
(2)在論文「What is Life? The Physical Aspect of the Living Cell」(1943)中,薛定谔提出了其對活細胞的實體觀。他指出,生命賴負熵為生,機器賴秩序為生,機器可作為認知的載體。
(3)論文「Cybernetics, or Control and communication in the animal and the machine」(1948)告訴我們,控制和互動可以實作具身智能。
(4)在論文「Computing Machinery and Intelligence」(1950)中,圖靈仔細闡述了通過機器産生「思維」的方法,指出可以從教育「兒童程式」開始,用對話做圖靈測試。奠定了其「人工智能之父」的地位。
(5)在論文「The Human Use of Human Beings: Cybernetics and Society」(1950)中,維納指出,機器和人類分别有各自的智能,應該互動認知、疊代發展。
「疊代」的英文單詞為「Iteration」,「互動」的英文單詞為「Interaction」,他們具有意義相近的詞根。我們不妨思考疊代與互動、互動與輸入輸出、疊代與進化的關系,進而幫助我們了解上述五篇論文。
如上圖所示,如果我們将李白的《靜夜思》翻譯為英文,再翻譯回中文,并将這一過程重複兩次,最後得到的中文輸出與原詩的意思出入很大,這種語義發散的現象展現了自然語言翻譯系統逐漸積累的不确定性。這裡的翻譯過程是一個「輸入-輸出」過程,每一步之間存在延遲。而在互動過程中,互動雙方應該同時工作。下一代人工智能研究需要更加注重互動和疊代關系。
在這裡,我們需要明晰「疊代」和「遞歸」的關系。疊代是往前走,是形而上的。疊代是循環的活動,某次疊代的結果會作為下次疊代的初值,不斷更新,累積發展。例如,人腦中知識的長期記憶,就是這樣自我複用,疊代成長的,又例如人類社會中的科學和技術也是疊代發展的。
遞歸則是往回找,是形而下的。遞歸是指在函數的定義中使用函數自身,每一次回溯稱為一次遞歸,需要用到前一次的值。例如,斐波那契數就是通過遞歸求得的,又例如智能機器中的程式常常是遞歸執行的,我們需要通過編譯系統将進階語言編譯為機器語言。
1 從薛定谔談開去——
機器用時序和互動維持負熵
機器通過時序和互動來維持負熵。達爾文的物種進化理論為我們探究生命本源和物種進化提供了基礎的理論。薛定谔、克裡克、坎德爾這三位諾貝爾獎獲得者對進化論的進一步發展也做出了巨大貢獻。就機器的生命觀而言,我們需要從進化論(物種多樣性)、遺傳學(基因工程,機器的遺傳資訊傳遞)、細胞學(認知神經生物學,尤其是學習和記憶)等角度展開讨論。
李德毅院士指出,農耕時代和工業時代的機器并不能算是生命。農耕時代的工具通常由「實體物質」和「虛體結構」這兩個要素組成,結構直接寄生在物質上,形成「硬構體」。例如:輪子、大刀、長矛。當我們将樹幹鋸開成樹墩,兩個平面就變成了切菜闆,此時它可以完成一定的功能,并不是單純的物質。工業時代的機器則由「物質」、「結構」、「能量」這三個要素組成,結構寄生在物質和能量上,形成硬構體。
2 智能時代機器的生命觀
在智能時代,機器(例如,自動駕駛汽車)具備四個要素:物質、能量、結構和時間。物質和能量是實體層面的真實存在,結構和時間是認知層面的抽象思維,用結構思考物質在空間的拓撲幾何關系,用時間思考物質的運動變化,以及能量的流動轉化。結構和時間寄生在物質和能量上稱為硬構體(例如,車底盤、內建電路晶片),機器裡的資訊是大量的「軟構體」(例如,駕駛腦程式、地圖、交通規則),展現精神,它們寄生在硬構體或者已有的其它軟構體之上,可以自我複用,機器的秩序顯示出維持自身和産生有序事件的能力,展現在認知和行為兩個方面。
如上圖所示,結構和時間存在于認知空間中,而能量與物質存在于實體空間中。結構和時間構成軟構體,軟構體是資訊的基礎,他們寄生在物質和能量上構成硬構體。能量和物質的關系遵循質能方程。
概念、消息、資訊和知識都是軟構體,用軟構體思維展現人的想象力和創造力,展現精神世界,是實體世界在人之空間的鏡像,是虛拟的現實。而硬構體填補了物質能量和資訊之間的鴻溝,使得資訊和物質難舍難分。既不是單純的物質能量也不是單純的資訊,好比「薛定谔的貓」。目前的內建電路晶片就是硬構體的「爆品」,稱為人工智能「卡脖子」技術的代表。
3 智能究竟是物質還是精神
舉例而言,作曲家創作的樂曲是軟構體,表達的是信、情感、藝術技巧和人文風格。同一首樂譜可以在不同的硬構體(樂器)上表現出來,無論用哪種硬構體支撐,表現的都是同一首樂曲。樂譜是精神的、非物質的,人們聽到的樂曲是客觀存在的聲音藝術,蘊含了物質、能量、結構和時間,展現美,也展現知行合一。智能在認知空間裡是精神的,在實體空間裡是物質的、具身的。
硬構體可以局部軟化成軟構體,例如:虛拟機器人;軟構體也可以局部固化為硬構體,如可互動、會學習、自成長的輪式機器人。物質和精神不同,但不是軟體定義一切。
4 機器為什麼可以作為思維的載體
從活細胞的實體觀來看,生命是「機器」;從機器的生命觀來看,機器是「生命」。具體而言,「實體層-物質」、「生化層-能量和時鐘」、「生理層-電子電路和機器指令」、「心理層-作業系統和中間件」、「認知層-高層軟體和資料」相對應。時間是機器認知的奠基石。機器裡有物質、能量、結構和時間,時鐘依賴能量,時間依賴時鐘,秩序依賴時間。軟構體寄生在硬構體上,機器自舉實作思維自動化,自我複用實作認知自成長,機器運作靠程式,程式靠時序,軟體靠互動,時序和互動産生負熵,機器賴負熵為生。時鐘不停,與外界互動不息,思維和認知不息。人的想象力和創造力提高了軟構體的品質和數量,展現為語言和心理。
5 圖靈談開去——
看圖靈機局限和圖靈對人工智能的貢獻
要追蹤圖靈 24 歲之後的學術思想,了解他如何從「計算機之父」走向「人工智能之父」,尤其要讀圖靈全集的第三卷「機器智能」、第四卷「數學生物學」(第一卷為數學、第二卷為邏輯學)。
自然進化的人類借助簡單的工具,計算圓周率 π 的小數位十分艱難。而 1950 年 ENIAC 誕生之後,就将計算出了 π 的 2037 個小數位,1954 年 NORC 用 13 分鐘計算出了 π 的 3089 個小數位。到 2011 年,超級計算機已經計算出了 π 小數點後萬億位。
曆史告訴我們,依靠人力計算 π 值,小數點精度提高 1 個位數需要用 1700 年,再提高 4 位需要 800 年;依靠圖靈機計算,軟構體複用,如果機器的時鐘精度足夠高,機器執行硬指令的時間周期足夠小,π 的小數點精度提高到 10^12 位,僅用了 70 年。如果每個人一秒鐘完成一次「乘加」的人力計算,那麼全球 70 億人需要花費 4 年時間才能完成超級計算機一秒鐘的計算量。
人們讨論生物自然進化現象,常用的時間尺度是「萬年」;讨論人類文明生态現象和體外智能,常用的時間尺度是「千年」;讨論人類思維和認知的進步,即科學技術的發展,常用的尺度是「百年」甚至「十年」。如果說,人類的生物進化出的本能是相對穩定的,科學技術和機器智能的發展卻是天翻地覆的,這種疊代的智能導緻的幾何級數增長的認知進步和知識爆炸成就了人類,科學技術成為人類社會發展的第一生産力。
随着計算機時鐘精度巨大提升,CPU 的工作頻率同步提升,相當于幼兒機器語言指令(無論是複雜指令集還是精簡指令集)的執行周期大大縮短,算力暴漲,當今機器圍棋程式和蛋白質折疊結構預測超過人腦,不足為怪,更重要的是可以反過來促進人腦的智力發展。
圖靈在他 38 歲發表的曆史文獻《計算機械與智能》中,開宗明義地要大家思考「機器能否思維」,他分析并駁斥了 9 種對思維機器的反對意見:
(1)上帝隻賦予人類思維的靈魂;
(2)機器會思維會帶來可怕的後果;
(3)機器思維能力一定是有限的;
(4)機器不僅能創作,還要能意識到自己是在創作;
(5)機器該不該出錯?機器可以成為自己思維的主體嗎?
(6)機器會思維,但不會令人吃驚;
(7)能夠讓機器回答 π 值是多少嗎?
(8)機器能夠處理意外之意外嗎?
(9)機器有心靈感應嗎?有超感官的知覺嗎?
圖靈主張教機器學習,隻要機器在語言行為(對話)上和人沒有明顯差别,就是能思維或有智能了,這就是後人所稱的「圖靈測試」。他認為,可以編制一個「兒童程式」,它是一種寄生在硬構體「幼兒認知核」上的軟構體。然後對其進行教育(指導學習、自主學習),進而達到成人的智力水準。
6 活細胞的實體觀和機器的生命觀
從幼兒認知核的角度來看,目前學術界關注的神經網絡系統對應人腦的大腦皮層系統,包括前頭葉、頭頂葉、側頭葉、後頭葉四大塊。然而,人腦十分豐富,還包含腦幹、腦髓、胸髓、中樞神經等部分。幼兒認知核将智能基因移植過來,展現大腦新皮質學習的本能,可自舉,可自我複用,可成長。
進化論告訴我們,意識、情感、欲望和性格比新皮質早了幾億年,不在同一條起跑線上。人的智能展現在 300 萬年來大腦皮層的進化上。目前,研究人工智能還不能一蹴而就地同時研究上述五個層面,可以先排除意識、情感、欲望和性格,單獨将智能抽離出來。如上圖所示,紅色部分為 2 億多年前爬行動物的烙印,黃色部分為 1 億多年前哺乳動物的烙印。
學習是「感覺-認知-行為」的循環過程。認知不可能獨立于感覺和行為,是以需要克服圖靈機的兩個局限:
(1)孤立了認知,忽視了機器具身與環境的互動;
(2)孤立了計算,忽視了記憶。
從生命科學的角度來講,學習、記憶、教育十分重要。學習是一個互動的過程,包含指導學習和自主學習。此外,瞬時記憶、工作記憶、長期記憶的分工是人類進化的重要标志,才産生了曆史和人類文明。同一主體的豐富軟構體大緻自洽,是弱統一體;靠記憶形成邊界來限制思維。記憶先于計算、優于計算。各智其智、智人之智、智智與共、多元認知、相容并包才是常态。
将智能等同于計算的觀點相對狹隘。計算是智能的一部分,但智能不僅僅是計算。李德毅院士指出,智能是培養和傳承解釋解決預設問題的學習能力,以及解釋解決現實問題的能力。
預設問題通常來自現實問題,并已經被證明有了行之有效的解決方案,學習是把未知變為可知,是解釋解決新問題的基礎,解釋解決現實問題是學習的目的,兩者互相促進,學習的結果是修飾、修剪或重塑記憶,所謂「學而不思則罔,思而不學則殆」。
愛因斯坦認為,智能是學習知識或使用知識的能力。李德毅院士認為,智能還應該包含創造知識的能力。人類的智能包含計算智能、記憶智能、行為智能、感覺智能。其中,計算智能和記憶智能存在于認知空間,是認知思維能力,分别解決為什麼、是什麼的問題。感覺智能(觀察能力,例如:時空識别、目辨別别、模式識别)和行為智能(運動能力)存在于實體空間,分别解決在哪裡、怎麼做的問題。其中,模式識别需要用到記憶,更需要用到人類在進化過程中發展出的對視覺知覺的判斷。學習包含指導學習和自主學習。而教育作為人類最偉大的發明之一,将進化的進行時變成了學習的現在完成時。
7 從維納談開去——
互動認知:具身行為的控制
維納說,互動和控制非常重要,要對被控制對象進行負回報。他認為,如果我們使用一台機器來實作我們的目标,但又不能有效幹預其運作方式,那麼我們最好能确定輸入給機器的目标是我們真正所預期的。麥卡錫則認為:「人工智能本應該叫控制論,是智能的自動化」。
控制就是追求熵減,通過負回報,確定機器具身行為智能的穩定性。自動控制是強化學習的發源地,任何獎罰函數,可以與偏差為零的回報控制等價。
8 使命對齊和具身行為控制
機器的使命和行為是由人賦予的。機器能夠通過與人的有效溝通來完成預設的任務,人要和機器互動,逐漸地教會機器了解人設定的任務目标。這個任務目标逐漸統一的過程可稱為使命對齊。當今的深度學習等屬于感覺智能,缺乏對人賦予使命的認知了解。隻有當機器通過人機互動,讀懂了人賦予的使命,靠使命驅動,才算是實作自主智能,更好地服務于人類。
楊樂昆在其未來工作設想中,建構了一個由世界模型、感覺、配置程式、成本函數、效應器等部分組成的系統。這一系統與李德毅院士提出的「駕駛腦」概念有很多不謀而合的地方。駕駛腦包含感覺、認知、行為等部分,涉及瞬時記憶、工作記憶、長期記憶,需要學習車輛動力學控制車體行為。深度學習想要真正進一步發揮作用,應該在疊代和互動的過程中實作,而不僅僅是使用預訓練。
機器有感覺、有認知、有行為,可互動、會學習、自成長,教機器讀書做題也好、開車也好,就是在互動的環境裡,由軟構體裡的算法規定的一組帶有獎勵和懲罰函數在内的、周而複始的複雜動作,通過疊代和互動完成在瞬時記憶區、工作記憶區、長期記憶區狀态的改變,通過自動控制展現具身智能。這種強化學習,是人賦予機器使命的重要方法。
9 機器學習和機器作業中的互動和協同
具體而言,互動智能是通過跨模态感覺,實作行為的外循環,包含感覺、認知、控制、回報四個部分。感覺要展現瞬時記憶的豐富性、複雜性、精确性。在短記憶中完成态勢生成和标注,彌補人類的注意力對豐富資料了解的簡化能力。
記憶智能是異構、并行的瞬時、短時和中長期記憶之間的協同。每一次學習都會激活中長期記憶的一部分用來指導當下的學習,每一次學習都會利用短時記憶對中長期記憶進行微重構。
記憶和計算應該協同,構成多元智能。瞬時記憶的完成由以資料驅動單元為主,短時記憶的完成由 TPU 和 GPU 為主,中長期記憶由搜尋引擎、知識庫機為主。計算工作以 CPU 為主,還需要 FPGA。新一代人工智能一定是異構、超異構的架構。
10 從薛定谔、圖靈、維納談開去——
疊代的智能:從學習到創造
機器思維離不開語言,孤立的機器自然語言處理,不與人實時互動是走不通的。自然語言的任意性,普遍反映在使用的不确定性,即多樣性。不唯一性引發歧義、多義或含蓄,同樣的一句話可以有不同的含義,不同人或不同語境下也都可以有不同的了解,這正是自然語言的魅力。
未來,機器的智能會在多樣化和常态化的「圖靈測試」中疊代成長。目前由人賦予機器特定的語境和語用,讓機器寫作,生成三字經、百家姓、千字文、開幕詞閉幕詞、新聞稿等文案已經屢見不鮮,機器寫作的專業論文已經有被會議收錄發表,機器作畫、批改作業和試卷,線上評估和指導學生日常學習等活動已經常态化,圖靈測試有可能區分不出來哪些行為是機器所為。
唐詩宋詞對應于機器寫作圖靈測試;數學語言對應于定理證明圖靈測試;實體學預言對應于無人駕駛圖靈測試;法律語言對應于機器律師咨詢圖靈測試。實際上,自然語言是所有機器語言的元語言。語言能力是機器智能的傑出表現,機器用語言思維先要把語言形式化,隻有形式化才可以機械化,而後自動化,一旦自動化,思維的深度就會超越人。
11 可互動、會學習、自成長
稱為智能機器的硬核
可互動、會學習、自成長的機器人作業流程如圖所示。在認知空間中,機器的通過感覺情景形成瞬時記憶;将感覺結果聚焦并通過計算記憶形成工作記憶,工作記憶可以從提取長期記憶,用過去的經驗回報目前态勢下的應對政策,也可以修飾長期記憶;工作記憶可以被用于行為決策。在實體空間中,通過工作記憶得到的行為決策被用于控制,而被控制的對象為機器具身。該系統通過具身行為回報、注意力選擇、傳感器感覺環境回報進行學習。
12 人與機器認知互補、如影随性、疊代提升
自然選擇并沒有「過分」地進化人類這個物種,人類變得智能不是進化的必然,知識給了人類出生後認知二次擴張的潛力,正如同機器可以終身學習。
人使用自熱語言思維,機器使用形式化語言思維并被機械地執行;人思維有多樣性和活躍性,機器思維有必然性和統一性;人類思維速度受限于生命的生化參數基線,而實體的機器則可暴力計算和暴力思維;人有豐富的想象力和創造力,機器有一以貫之的執着。總有一天出現機器工程師創造出新材料的配方,機器科學家提出新的假設,驅動産生新的科學發現。
人工智能成為人類文明生态,使得人與機器可多通道、跨模态互動認知,讓人發揮人的智慧,機器發揮機器的智能,形成疊代的智能。
綜合考慮圖靈和薛定谔的理論,我們可以得出「機器是生命,生命是機器」的論斷;圖靈和維納的理論則指出了「智能自動化,行為可控制」的研究目标。
人類本應抑惡揚善,如果人就是攪局者,當然機會也會幫忙造假,工具從來都是雙刃劍。把機器人格化,責備機器人存在倫理問題,隻是在逃避人的責任。
13 看見未來:疊代的智能
用生命的觀點看機器,構造賴時序和互動為生、即賴負熵為生的智能機器;用實體學的觀點看認知,以物質、能量、結構和時間為基礎,用軟構體表達思維和認知,自我複用産生有序事件,維持不确定性中的基本确定性,在人與機器之間,在實體空間和認知空間,形成交替認知的螺旋,會學習,自糾錯、自組織、自成長,顯示出解釋、解決問題的認知能力,知行合一,形成疊代的智能。
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社群進行轉載!
公衆号轉載請先在「AI科技評論」背景留言取得授權,轉載時需标注來源并插入本公衆号名片。