天天看點

人工智能迷途:計算機的高技能等于高智能嗎?

作者:王培,美國天普大學計算機與資訊科學系

人工智能(Artificial Intelligence,簡稱AI)開始于一個很簡單的想法。當計算機被發明之後,不少人很快認識到它的能力遠不限于數值計算,而是可以通過對資訊編碼和對指令程式設計完成很多其它以往隻有人腦才能完成的任務。這自然就導出了是否人腦的功能都能在計算機中實作的問題。這類研究開始有不同的名稱,最後“人工智能”這個詞被大多數人接受了,盡管對其解釋始終沒有統一。

人工智能迷途:計算機的高技能等于高智能嗎?

圖靈(Alan Turing)。

開始,AI研究者們以為可以在不遠的将來實作他們的目标。這個領域的先驅圖靈在1950年預言在五十年内可以造出言語行為和人難以分辨的“思維機器”,而這個領域的創始者明斯基和西蒙等人的估計甚至還要更樂觀些。在AI曆史上,曾經有過一些雄心勃勃的研發項目,如紐厄爾和西蒙的“通用問題求解器”和日本政府牽頭的“第五代計算機系統”等,但都沒有達到預期目的。這些失敗讓AI的名譽受到巨大的負面影響,導緻經費斷流、人員出走、崗位削減,史稱“AI之冬”。

人工智能“腦死亡”了?

痛定思痛,AI的大部分研究者覺得失敗的原因是前輩們太好高骛遠了。用一本權威AI教科書[3]的說法,在八十年代末“人工智能接受了科學方法”,其特征是從熱衷于發明新理論轉向基于經典理論,從期望發現一攬子解決方案轉向解決具體問題。這使得AI着力于一個一個地解決各種以往隻有人能解決的實際問題,或一項一項地再現人的認知功能。由于各種“專家系統”在很多領域達到甚至超過了人類的水準,AI終于擺脫了“現代煉金術”的惡名。廣為人知的例子包括戰勝了國際象棋世界冠軍的“深藍”系統和近年來風頭正勁的“深度學習”技術在圖像、語音識别等領域的應用等。

但這個從通用系統向專用系統的轉向是有代價的。由于“隻有人能解決的問題”在不同的時期有不同的内容(如曾經包括四則運算、排序等),以此定義“人工智能”實際上把它看成了計算機應用的前沿。由于這個前沿在不斷擴充,所面對的問題千差萬别,解法也因問題而異,是以不可能全被囊括于一個理論之中,是以也就說不清AI和普通計算機應用到底有什麼差別。甚至有人說“人工智能”專指那些尚未被計算機解決的問題,因為一旦一個問題被計算機解決了,它也就不再是“隻有人能解決的問題”了。以這種标準來界定一個研究領域自然會造成大量的思想混亂。

即使我們完全不在乎“人工智能”到底是什麼意思,隻是以“能抓耗子”來定義“好貓”,這種“分而治之”的戰略仍有緻命問題存在。人類的各種認知功能顯然是有緊密的互相依存關系的,而人在各個領域的問題求解能力也不乏相通性和可轉移性。在目前AI各子領域中,都有不少核心問題是依賴于其它子領域的。以自然語言了解為例,有什麼證據說明語言了解能力是和推理、學習、記憶、感覺、規劃、決策等能力無關,而可以“就語言論語言”的?

對上面的诘問的常見答複是:智能之中的諸功能當然是互相依賴的,但由于它們太複雜,隻能一個一個研究,将來再把它們內建一個完整的智能系統。或者說當具體問題解決多了,普适的辦法也可能就找到了。

這種戰略在很多領域的确是恰當的,但在AI研究中似乎并非如此。解決具體問題的最有效手段常常是通過深入分析該問題的特點得到的,是以未必能推廣到其它問題。比如說“深藍”的技術對計算機下圍棋就不适用。類似地,當某種認知功能被孤立定義成一個計算過程時,其結果和該功能在人腦中的“原生态”常常已經是大不相同了。大略翻翻一本AI教科書(如[3]) 就不難發現大量針對各種問題的解決方案。把它們都編成程式裝到同一個計算機系統裡并不難,難的是讓它們協調工作。由于這些方案是基于不同的理論和預設的,它們完全沒有協作的基礎。這就解釋了為什麼整合各種AI功能的呼籲(如[1])收效甚微。

更重要的一點是,即使是這些打上“智能”标簽的技術仍常常讓我們覺得缺了些重要的東西。的确,它們在很多方面比人更強,因為它們速度更快、容量更大、功能更穩定,但是這本來就是計算機的長項,而它們仍然缺乏适應性、靈活性、創造性等直覺上和智能密切相關的特征。即使是最新的機器學習算法也仍然受制于其中種種對應用領域的預設,因而和人的學習能力的普遍性不可同日而語。

明斯基曾在一次采訪中對AI主流轉向專用系統大表不滿,斥之為“AI已經腦死亡了”。

通用人工智能的崛起

其實就像曆史上類似情形中那樣,總還是有些不改初衷的研究者,盡管他們隻能在學術界的邊緣沉默堅持。在2001年,他們中的一些人為了改變這種狀況,開始把他們的研究成果編成一本書。最早草拟的書名是《Real AI》(真正的人工智能),在2003年全書完稿時定為《Artificial General Intelligence》(通用人工智能,簡稱AGI)。這本書在出版過程中又經曆了些周折,故2007年才得以面世[2]。在此期間,在2006年于華盛頓特區召開了為期兩天,大約50人參與的AGI研讨會([4]就是這次會議文集的引言)。在這些準備活動的基礎上,AGI年會(http://agi-conf.org/)從2008年開始舉辦,而AGI學報(http://www.degruyter.com/view/j/jagi)也在2009年創刊了。時至今日,AGI的概念已經廣為流傳,盡管人們對其有各種各樣的了解和反應。

一個常常被當作AGI同義詞的概念是“強人工智能”(Strong AI)。直覺來說這是可以了解的,因為AGI的野心顯然比目前的AI要強很多。但是按照這個詞的發明人哲學家塞爾的說法,即使一個計算機系統的外部表現完全像人,那也隻是個“弱人工智能”,而“強人工智能”必須真正擁有自我意識。這樣一來一個AI系統是“強”還是“弱”就完全沒有外部标準了,這是很多AGI研究者所不同意的。

與此相反,AI和AGI的差别是有明确外部标準的。如果要用一句話來概括,可以說AGI是把“智能”看作一個問題,而目前主流AI是将其看作一組問題。從AGI的觀點看,“智能”當然是個很複雜的問題,必須一步一步地解決,但這裡的“一步”不是“下圍棋”、“識别照片中的事物”或“聽懂中國話”,而是要根據一個智能理論來劃分。這就像蓋一棟房子應該從畫圖紙開始,然後據此一間間、一層層地建,而不是各人根據自己的想法分别去建客廳、書房、卧室、廚房、閣樓、衛生間等等,最後再設法把它們拼在一起。這聽上去像常識,隻是這樣工程周期顯然比隻造一個房間會長很多,而且在全部完工之前不容易看出好壞。是以,在主流AI的工地上,絕大部分施工隊都在忙着造各種房間,而不願花功夫去捉摸那些成敗難料的圖紙。

盡管有“建造多功能通用系統”這個共識,目前AGI領域内對“智能到底是指什麼”仍舊未達成一緻意見。既然對“做什麼”都有不同看法,對“怎麼做”的答複就更是百家争鳴了。盡管如此,已經有若幹AGI項目離開了紙上談兵的階段,開始有具體系統可以被檢驗了,雖然離完成都還有很遠的距離。

高技能≠高智能

在AGI中的“G”(General)不意味着能解決一切問題,而是指在系統設計時不限定其應用範圍。“通用”自然是個程度問題,“通用”和“專用”也是相對而言的,但這個差别仍然是明顯存在的,比如“深藍”就完全不能算個通用系統。一個常見的誤解是把一個通用系統看作一批專用系統的組合。實際上它們是兩類非常不同的系統,不能互相替代。不僅AGI不能通過堆砌現有AI技術來實作,而且即使在AGI實作後也不會抹殺專用技術的價值。如[4]中所指出的,對一個可以明确刻畫的應用問題而言,專用系統往往比通用系統更有效和更可靠。通用系統的應用價值是在那些問題和解法都難以事先确定的領域。在理論價值上,這二者的差别就更顯著了。各種現存AI理論對于揭示智能的一般原理貢獻甚微,而AGI理論則往往是從一般原理入手的。

我曾介紹過我對“智能”的工作定義是“在知識和資源相對不足的條件下的适應能力”。按照這個定義建構的系統可以被置于很多不同的環境中,而其智能使得它能夠逐漸通過學習獲得在該領域解決問題的能力。照這種觀點看,“智能”不是“解決具體問題的能力”,而是“獲得解決具體問題的能力的能力”,是以是一種通用的“元能力”(meta-ability)。

我對于“能力”和“元能力”的差別的最早認識來自于小時候讀到的一個寓言故事。故事的架構很老套:兩兄弟遇到一個白胡子老神仙,他們選擇了不同的法寶,是以走上了不同的人生道路。這個故事的特别之處是其中的法寶是兩雙手套,一雙是白色的,另一雙是黃色的。帶上黃手套就可以直接擁有各種技藝,而帶上白手套就可以很快學會各種技藝。後面的情節大家都能猜到:選了黃手套的馬上變身為成功人士,而選了白手套的仍需四處學徒。有一天兩個法寶同時失效了,這時前成功人士立刻被打回原形,而那位前學徒工卻仍身懷長技。這個故事的出處我已經找不到了(如果哪位讀者知道請告訴我),兩雙手套的顔色也可能被我搞反了,但故事中的教益卻對我影響深遠,且不僅僅是“不要貪圖急功近利”這麼簡單。

在我看來,“能力”可以被分解成“技能”和“智能”兩個方面。一種“技能”指解決某類問題的專門化能力,而“智能”指那種獲得和提高各種技能的能力。如果把系統的總技能看成時間的函數,那麼智能就是這個函數的導數。系統在某一時刻的技能等于其“本能”(先天技能)部分和智能所貢獻的部分的疊加。這兩個部分的關系在人類和計算機系統中非常不同。因為人類的本能差别較小,同齡人的技能差别可以近似地反映智能差别,這就是“智商”定義的基礎。相反,計算機系統的技能既可以來自本能,也可以來自智能。當一個計算機系統完全靠人編的程式解決問題,而不根據自己的經驗對其行為進行任何調整時,它仍可能擁有很高的技能,但完全沒有智能。而另一方面,一個高智能系統如果不依賴于預先編好的應用程式,在開始運作時可能并沒有多高的技能。

根據上述分析,把人類智商測試直接用于人工智能是錯誤的,因為計算機系統在一個時刻的“智能值”和“技能值”之間沒有相關性,而前者必須通過後者的變化來衡量。智能的具體衡量标準和方法仍是AGI領域中的一個熱點課題,但無論如何,這種衡量不能以一套固定的考題來進行,因為那樣一來,一定會有人去編制一些在這種考試中表現出色,但此外一無所能的系統。這絕不是正确的導向 — 圖靈測試已經是以而遭到“鼓勵欺騙”的指責了。

“機器學習”還遠遠不夠

把智能了解為學習能力遠非新想法。心理學家如皮亞傑已經明确地指出智能是一種進階适應能力,圖靈認為思維機器要通過學習實作其功能,而“機器學習”從一開始就是AI的一個子領域。在這種情況下,為什麼上述想法不能在主流AI中發展呢?這是因為像“智能”一樣,對“學習”這個概念也有許多種不同的了解,而我的了解和主流AI的很不一樣。

如上所述,我認為“學習”是一個通用的元能力,而且是智能的必要條件,但在目前的AI研究中,“學習”一般是被看做是諸多認知能力之一,是起錦上添花作用的,因而AI系統不一定都有學習能力。即使在機器學習的研究中,“學習”也是一般被看做達到一個确定的輸入輸出關系的手段。這種學習系統的技能在“訓練”階段的确随時間增長,但達到某個水準後學習就停止了,而此後系統進入“工作”階段。與此相反,在我的設計中,系統沒有截然分開的“訓練”階段和“工作”階段,學習是終生的,無處不在的,盡管在系統的“幼年期”和“成年期”學習和工作的比例有量的差別。最後,目前各種機器學習算法雖然有一定的通用性,但離AGI的要求還相差很遠。

“錯把技能當智能”是一個目前普遍存在的問題。對于隻關心某個具體應用的人來說,到底一個計算機系統的某項功能是程式員設計好的還是系統自己學的,其間的差别大概并不重要,但如果關注點是系統的發展潛力和适用範圍,這裡的差别可就大了。

以我的研究為例,“知識相對不足”意味着系統必須不斷學習新知識以應對新問題,而“資源相對不足”意味着系統必須不斷調整政策以滿足時間限制,而這種運作環境是不在現有AI研究(包括各種學習算法)的視野之内的。更大的差别展現在對階段性結果的評價上。由于我的工作不是基于現有主流AI所接受的理論(主要是數理邏輯、機率統計、計算理論)之上的,而且尚未有具體應用成果,這種工作在他們看來就沒什麼價值。反過來,在我看來主流AI做的基本是“人工技能”,也不是我所感興趣的。雖然其他AGI研究者和我的觀點不完全一樣,他們同樣對主流AI的現有規範不滿,而對AGI的研究目标和評價标準有更強的認同感。

目前介紹AI技術熱點的報道很多,但其中的問題也不少,尤其是常常把這些技術做直覺了解和外推,因而賦予它們很多它們本來不具有的性質。我寫這篇文章的初衷是以我自己的研究為線索,逐漸、系統、深入地分析AI、AGI和認知科學中的一些理論問題,澄清一些核心概念,并簡單地介紹一個完整的智能理論。之是以牽扯到認知科學,是因為包括我在内的一些AGI研究者的目的不僅僅是要造思維機器,而且希望循此途徑認清智能、認知、思維、心靈、意識等現象的本質和一般規律,這就不可避免地涉及到心理學、語言學、哲學等相關學科,而所謂“認知科學”正是指這些學科的交叉區域。我知道有很多讀者的興趣是在“人工智能是否會威脅人類”之類的話題上,但目前的這類讨論大量充斥着概念錯誤,是以在涉及這些話題之前,我們還是需要先把基本概念搞清楚。

參考資料

[1] Ronald J. Brachman, “AAAI Presidential Address: (AA)AI — more than the sum of its parts”, AI Magazine 27(4), 19-34, 2006

[2] Ben Goertzel and Cassio Pennachin (editors), Artificial General Intelligence, Springer, 2007

[3] Stuart Russell and Peter Norvig, Artificial Intelligence: A Modern Approach, 3rd edition, Pearson, 2010

[4] Pei Wang and Ben Goertzel, “Introduction: Aspects of artificial general intelligence”, in Advance of Artificial General Intelligence, 1-16, IOS Press, 2007