天天看點

重振人工智能雄心壯志的時刻已經到了

重振人工智能雄心壯志的時刻已經到了

創造人工智能遠比人們想象的更具挑戰性。然而新的人腦及機器思維研究中心已準備再試一次。這一次,計算機科學家、生物學家和神經科學家将一起處理這個問題。

在1955年夏天,4名頂級美國數學家(那時還沒有“計算機科學家”這個術語)倡議在達特茅斯學院召開了一次會議,來探讨被他們稱為“人工智能”的主題。“這項研究是在一個猜想的基礎上進行,那就是學習的每一方面,或智能的任何其他特征,可以在原則上被精确地描述為,能夠造出一部機器來對其進行模仿,”倡議書說。

這次會議于1956年進行,為期一個月,通常被認為是人工智能研究的起始。倡議書作者中的三人,即表處理語言(lisp)發明者約翰·麥卡錫(john mccarthy),麻省理工學院40屆理學碩士、40屆博士、資訊論先驅克勞德·香農(claude shannon),以及後來的圖靈獎得主馬爾溫·明斯基(marvin minsky),稍後都曾在麻省理工學院授課。

麥卡錫和明斯基(55年後他仍是麻省理工學院教師)創立了麻省理工學院人工智能實驗室。到1967年,計算機技術發展迅速,明斯基在他的書《計算:有限和無限的機器》(computation: finite and infinite machines)中大膽寫道,“我确信,在一代人的時間内,智能的各個部分,鮮有哪個會在這部機器(電腦)的領域之外,創造‘人工智能’的問題将在本質上解決。”

當然,明斯基的預測過于樂觀。早期人工智能研究者把赢得國際象棋比賽當成智能應用的範例,但後來發現這比區分口語詞彙或識别面孔之類計算問題要容易得多。

在20世紀80、90年代,随着複制人類智能的難度逐漸清晰化,人工智能具有了某些非常不同的含義,那就是實用的專用計算機系統,通常基于“機器學習”,這應用到對大量訓練示例的統計分析。正是這一手段給了我們語音識别和自動文本翻譯功能。

麻省理工學院的研究者們相信,現在是重振人工智能雄心壯志的時刻了,因為有希望開發出更好的治療神經紊亂的療法,以及能以人類直覺預測我們需求的計算機系統。美國國家科學基金會(national science foundation)似乎也同意這一點。

去年9月,該基金會宣布為人腦及機器思維研究中心(center for brains, minds, and machines,簡稱cbmm)捐贈2千5百萬美元,該中心位于麻省理工學院的麥戈文腦科學硏究所(mcgovern institute for brain research)。

麻省理工學院為該中心提供12名主要研究人員,另有6人來自哈佛,還有5人來自其他機構。

cbmm由托馬索·波焦(tomaso poggio)上司,他是一名腦科學和人類行為學教授,也是麥戈文研究所和計算機科學與人工智能實驗室(computer science and artificial intelligence laboratory,簡稱csail)的首席研究員。

對他的雙重身份展示了新中心的首要理念:如果能夠把計算、生理和心理的方法相結合,我們就能比孤立研究更快地了解人類智能。“這個中心嘗試的是,為了複制人類智能,需要對大腦和認知了解更多,而不是像50年前那樣僅僅依靠計算機科學,”波焦說。

帕特裡克·溫斯頓(patrick winston)是電子工程和計算機科學系教授和cbmm的研究協調員,他補充說,調查問題的技術在近年來有着顯著的提升。

溫斯頓說,首先,“計算是自由的,不論需要何種類型的計算,都能夠做到。”他還說,其次,“fmri 現在已成正常。”fmri 是指功能性磁共振成像,可用于研究大腦活動。

他還指出了一些技術,例如經顱磁刺激,能夠在認知測試中擾亂特定大腦區域的活動,以及光遺傳學,這種技術利用光來選擇性地激活或沉默大腦中的轉基因神經元。

光遺傳學的先驅是99屆工程碩士埃德-博伊登(ed ­boyden),他是麻省理工學院媒體實驗室(media lab)的教授,也是麥戈文研究所和新中心的首席研究員。

中心的研究圍繞幾個主要的主題或要點包括:視覺智力,其中內建了視覺、語言和運動技巧;智力回路,将包括神經生物學和電氣工程學的研究;智能發展;以及社會智能。

波焦是視覺智力的主要研究者之一,他還将上司一個理論平台的開發,旨在将研究結合在其他領域。對于每一個要點,cbmm研究者們正緻力于定義一組基準的問題,令他們可以以此來評估他們的進展。

波焦提供了一個例子,與他之前在視覺系統的研究相關。面對一副人們互動的圖像,一台智能計算機應當能為5個問題提供合理的答案,從易到難分别是:圖像裡有什麼?圖像裡都是誰?人們在做什麼?誰在對誰做什麼?接下來會發生什麼?

不變量

探索圍繞着人類智能的所有問題的理論架構,是一個艱巨的任務。但是波焦對于大腦如何回答他清單上的第一個問題的研究,為這一架構可能的樣子提供了一張草圖。“圖像裡有什麼?”是人工智能研究的一個蓬勃發展的領域,需開發物體識别的電腦系統來能夠回答這個問題。通常,物體識别系統會使用某些種類的機器學習。人類标記樣本圖像,訓示哪些物體出現在哪裡,接着系統會嘗試識别該物體在所有圖像上所共有的一些常見特性。“這與人類學習或動物學習完全不同,”他說。“當一個孩子學習認識一隻熊或一隻獅子,你無需為他展示一百萬次獅子的照片。大概兩到三次就夠了。”

波焦認為與機器學習系統不同的是,人腦是以一種“不變”的方式描繪物體:不論物體有多大,是在視覺區域的何處,還是在旋轉的,描繪出的都是一樣的。他還相信,自己對這種描述的可能構成有一個看上去合理的理論。

波焦的理論需要大腦或嘗試模拟大腦的電腦系統存儲一些物體的一塊模闆,其中包含這些物體的每一種變化——類型、位置和在平面上的旋轉。例如,大腦可能會存儲一張人臉的幾十張圖像,描繪出其360°的旋轉角度。

一個陌生的物體将被描繪成一個“點積”的集合,介于其圖像和模闆之間。點積是線性代數的一種标準算法。不論該物體的大小、位置或方向如何,該集合總會維持原樣。

該理論具有說服力的一點是,點積把兩組複雜資料集(例如視覺圖像)的對比,減少到一個數字。點積的各個集合,即便是為多個模闆,也不會在記憶中占據太多空間。波焦說,另一個具有說服力的一點是,“對于神經元來說,點積是最簡單的計算之一,或許就是最簡單的。”

在實驗中,波焦的系統或許無法超越機器學習系統。但它需要較少的訓練例子,這表明它更好地複制了人腦的運作。對于大多數計算任務,人腦的方法通常是更好的。

波焦相信,積點的集合還能鎖定更抽象的概念。包括不同形狀物體叢集的模闆,就像一個骰子一面上的點一樣排列,或者排成一列或是圓形,能夠加強數字的概念。一個從不同透視關系觀察的平行線的模闆,能夠加強平行或透視關系的概念。“可能會有更多有趣的事情有待探索,”他說。

模糊思維

和波焦一樣,喬希·特南鮑姆(josh tenenbaum)是腦與認知科學系(department of brain and cognitive sciences,簡稱bcs)的教授和csail的首席研究員。他上司的cbmm開發要點,集中于直覺把握孩子也能展示的實體現象,同時他也進行有助于波焦上司的理論工作的研究。特南鮑姆解釋說,最早的人工智能研究集中在建構數學語言上,例如可以為“鳥能夠飛”和“鴿子是鳥類”等論斷編碼。研究者們認為,如果語言足夠嚴謹,計算機算法将能夠梳理編寫在其中的論斷,并計算出所有邏輯上有效的推論。但是,了解語言論斷所需要的背景資訊被證明遠比預期中要多。例如,并不是所有鳥都能飛。在不能飛的鳥類中,關在籠子中的知更鳥和翅膀斷了的知更鳥是有差別的,另一種差別是各種類型的知更鳥和一隻企鵝的差別。以手工編寫出足夠的這類常識性例外,以使最基礎類型的推理成為可能,被證明過分耗時。相比之下,通過機器學習,電腦可以自行學習某種東西的大量例子,并推斷這些例子的共同點。例如,通過1百萬張一隻獅子的圖像,機器學習算法可以量化自身的猜測:77%擁有這類視覺特征的圖像是獅子的圖像。但是,雖然這種方法對于明确定義的問題處理得不錯,例如識别鳥類的圖像,但在處理更抽象的概念時會遇到麻煩,例如飛行這種鳥類、直升機、風筝和超級英雄共有的能力。而比起文法和母性來說,飛行還算是一個具體化的概念。特南鮑姆和他的學生們已經開發出一種新型工具,名為機率性程式設計語言,其中融合了新舊人工智能的最佳特色。如同早期人工智能語言一樣,它包含了推理規則。但這些規則是機率性的。例如說食火雞是一種鳥,以特南鮑姆的語言編寫的程式估計會得出這樣的結論:食火雞可能可以飛。但假如程式随後被告知食火雞的體重将近200磅,它大概就會把飛行可能性降低。“在人工智能的兩個早期階段,最大的分歧在于符号對抗統計,”特南鮑姆說。“我們在數學方面的發現之一是如何将這兩點相結合,如何以這類符号語言進行統計推斷和機率推理。”

讀懂人們

波焦的五個基準問題中的第二個是“圖像裡都是誰?”。

這個問題長期以來一直與bcs教授南希·坎維舍(nancy kanwisher)的工作相關,她最知名的領域是,使用功能性核磁共振成像來識别和分析大腦的面部感覺專門區域。

坎維舍上司着cbmm的社會智能要點研究,她把這當成自己先前研究的自然延伸。“當你看一張臉時,你感興趣的不僅是基本的人口統計方面資訊,例如那具體是誰,他們是男是女,他們年齡多大,”她說。“你能說出的不僅是這個人快樂或悲傷,還有他們是自信還是躊躇,精力充沛還是被動。通過非常簡短的一瞥,我們能夠從一張臉上看出極為豐富的東西。”

坎維舍說,人類通過肢體語言,同樣可以推斷出很多關于人們情緒、意圖,以及與他人的關系。肢體語言有着符合計算模組化的優勢。她還援引了已故的納莉尼·阿姆巴迪(nalini ambady)的研究,後者是斯坦福大學的社會心理學家,曾開發出“薄片判斷”理論。

“在學期開始時,她錄下了哈佛課程助教在班級前講課,”坎維舍說。“然後她把這些視訊非常簡短的片段向心理學實驗的對象展示,并說‘為這名教師的效率打分’。這些人都是看到一個人在教室前對一個班級講話的幾秒鐘,甚至都沒聽到在說什麼。而她發現,這些評分結果,與那個人的實際學生的評分非常接近。”

坎維舍說,cbmm社會智能要點的第一個項目,将是設計一組實驗任務,令研究人員能夠量化人類社會知覺。一旦研究人員建立一條基線,他們就能進行一些研究,例如童年期間各項任務的表現,或是自閉症兒童不同于其他兒童的表現。

他們還能确認參與社會知覺的大腦區域,方法是通過功能性核磁共振成像來測量神經活動,或是通過經顱磁刺激來幹擾表現。在收集所有這些資料之後,他們将嘗試為大腦運作進行精确計算機模組化。

聽懂故事

波焦的清單上後邊的問題是“誰在對誰做什麼?”和“接下來會發生什麼?”這些問題吸引着帕特裡克·溫斯頓(patrick winston)。他認為,定義人類智能的特征就是講述和了解故事。

這種能力甚至在标記圖像過程中發揮作用。正如溫斯頓喜歡指出的一樣,一個人類能夠把一個人拿起杯子放到嘴邊的圖像識别為他在喝酒。如果這個人拿着杯子向前幾英寸,那他就是在敬酒。不過一隻貓頭朝上接着水龍頭裡的幾滴水的圖像,也會被人們識别為喝水的執行個體。

“你必須思考你所看到的是一個故事,”溫斯頓說。“它們得到相同的标簽,因為這是相同的故事,而不是因為看起來一樣。”

這就是把一個研究要點貢獻給視覺、語言,以及社會和運動技能的一個原因。為說明另一個原因,溫斯頓援引了發展心理學家伊麗莎白·斯皮克(elizabeth spelke)進行的一項實驗,她是前麻省理工學院教員,目前在哈佛,是發展要點的主要研究者之一。

斯皮克曾被一些實驗引起了興趣,在那些實驗中,研究人員把老鼠放在一間房間中心的一個旋轉平台上。食物被明顯地放在一個角落,但随後被擋闆遮住。相同的擋闆被安置在其餘三個角落,平台則被旋轉。

斯皮克決定将該研究擴充到人類兒童和成人上,隐藏物改為一個玩具或一串鑰匙而非食物。對于所有動物、兒童和成人來說,一旦旋轉停止,實驗對象或者走向被遮蔽物的角落,或者走向對角的角落(看起來和被遮蔽物的角落一樣),兩者機率相等。

研究者們還改變了實驗,為目标物體對角角落的牆上塗上不同的顔色。動物和兒童仍然以相等的機率選擇正确角落或對角角落,而成年人則可以相對可靠地找到目标。

這就是事情變得有趣的地方。如果成年人在前往目标前,被要求聽一段文本并背誦,那麼他們又會被截然相反的角落所混淆。收聽和背誦文本“消耗了人類的語言處理器,把他們降到了老鼠的級别,”溫斯頓說。“之後他們會說,‘是的,我可以看到藍色的牆,但卻沒能記住。’”

回答cbmm的基準清單上最進階别的問題,大概會比nsf最初資助的5年需要長得多的時間。不過波焦說,“是時候再試一次了。已經過了50年。我們不清楚這一次能否成功。但如果我們不去嘗試,就無從知道。”

原文釋出時間為:2014-07-27

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀