天天看點

DeepMind用深度學習模仿大腦推理,預測編碼智能推進一大步!

【新智元導讀】預測編碼理論認為,大腦的感覺、運動控制、記憶及其他進階功能,取決于真實經曆和大腦對未來的預測之間的差異。DeepMind新推出的“生成查詢網絡”模仿了大腦的預測編碼機制,明顯提升了預測系統的智能化水準。

上個月,人工智能公司DeepMind推出了一款新軟體,可以在虛拟房間内拍攝一些物體的單個圖像,并且能夠在沒有真人指導的情況下,從全新的有利視角推斷出三維場景的樣貌。這一系統名為生成查詢網絡(GQN),它可以成功模拟簡單的視訊遊戲式迷宮的布局。

GQN有很典型的技術上的應用,不過它同樣引發了神經科學家的關注,他們對用于學習如何執行任務的訓練算法特别感興趣。GQN能夠由給定的圖像生成關于場景樣貌的預測,比如定位目标的位置,陰影在平面上的投射樣式,在某些視角下,哪些區域是應該可見還是隐藏,并利用預測結果與真實觀察結果之間的差異,來提高其未來預測的準确性。“正是現實與預測之間的差異,使得模型能夠不斷更新。”該項目負責人之一Ali Eslami說。

Eslami在該研究上的合作者、也是他在DeepMind的同僚Danilo Rezende表示,“算法會改變預測模型的參數,是以下次遇到相同的情況時,它就不會顯得那麼驚訝了。”

長期以來,神經科學家一直懷疑大腦的運作方式也遵循與此類似的機制。(這些推測确實是啟發GQN團隊探尋這種方法的一部分原因。)根據這種“預測編碼”(predictive coding)理論,在認知過程的每個層面,大腦都會産生一些關于應該自其下面的層級接收到哪些資訊的模型和觀點。這些觀點被轉化為關于在特定情況下的經曆的預測,提供令這些經曆說得通的最佳解釋。然後将預測結果作為回報發送到大腦的較低級的感覺區域。大腦将自己的預測結果與收到的實際感官輸入内容進行比較,并“搪塞掉”任何差異或預測錯誤,并可以通過使用其内部模型來确定出現這種差異的可能的原因。(例如,我們可能根據某個内部模型将一張桌子視為一個由四條腿支撐的平面,但即使桌子被其他東西遮住了一半,我們仍然可以認得出這是一張桌子。)

無法解釋的預測誤差會通過更進階别的連接配接(作為“前饋”信号,而不是回報)傳遞,這裡,預測誤差被認為是值得注意的現象,系統需要注意并做出相應處理。倫敦大學學院的Karl Friston說:“現在的關注點在于内部模型的調節,關注大腦動力學,來抑制預測中的錯誤。” Friston是著名神經科學家,也是預測編碼假設的先驅之一。

在過去的十年中,認知科學家、哲學家和心理學家将預測編碼作為一個令人信服的想法,尤其是用于描述感覺的運作機制,而且将其作為一個關于整個大腦運作機制的更具雄心、包羅萬象的理論。直到最近才有實驗工具開始直接測試這一假設的具體機制,過去兩年内發表的一些論文為該理論提供了驚人的證據。盡管如此,該理論仍然存在争議,最近,關于一些具有裡程碑意義的實驗結果是否可重複的争論,可能該理論存在争議的最好的證明。

咖啡、奶油與狗

“我喝咖啡喜歡加奶油和____。”這個句子用“糖”來填空似乎是很自然的。這也是加州大學聖疊戈分校的認知科學家Marta Kutas和Steven Hillyard的本意,他們在1980年進行了一系列的實驗,他們在實驗中将這句話逐詞放到大螢幕上給人看,并記錄下觀衆的大腦活動。隻不過,出現的最後一個詞并不是“糖”,而是“狗”。整個句子變成了:“我喝咖啡喜歡加奶油和狗。”

研究人員注意到,當研究對象看到“狗”這個出乎意料的詞時,會出現更激烈的大腦反應,這些反應的具體特點為“特定模式的電活動”,稱為“N400效應”(N400 effect),在“狗”一詞出現大約400毫秒後達到峰值。但研究人員仍不清楚應如何解釋這一現象。大腦作出反應,是因為這個詞的意思在本句背景下是不合常理的?還是因為大腦沒預料到這個詞的出現,它違背了大腦對預期出現内容的預測?

2005年,Kutas和她的團隊進行了另一項研究,表明後一種假設是對的。實驗對象再次要求讀螢幕上逐詞出現的一句話:“這天微風陣陣,是以男孩子們出去放____。”因為“風筝”(a kite)似乎是最有可能用來補完句子的詞,是以接下來實驗對象的期望是冠詞“a”,它沒有内在意義,但表示接下來還會有一個詞。而當參與者看到接下來的詞是“an”時,他們就經曆了N400效應,這似乎是因為大腦必須處理其期望與現實之間的不符。顯然,這一效應與該詞的含義以及處理出現的刺激本身的困難程度無關。

2005年的這一發現似乎非常适合預測編碼架構理論。但今年4月,eLife發表的一篇論文稱,有幾個實驗室無法重複這一實驗結果。現在,也有研究人員開始做出回應,一些人聲稱重複實驗的微妙結果仍然有利于基于預測的解釋。

這種搖擺不定反映出關于預測編碼理論的大部分争論。像Kusta這樣的實驗可以有許多種解釋。比如可以通過除預測編碼之外的模型來解釋,并且這些實驗缺乏足以證明假設的确實證據,因為它們沒有深入研究實際的機制。雖然大腦會不斷做出推論(并将這些推論與現實進行比較)的想法已建構得相當完善,但預測編碼的支援者一直在設法證明,他們所主張的理論才是正确的,而且可以延伸到所有的認知領域。

貝葉斯大腦與高效計算

大腦一直建立和評估自己對持續的實際經曆的預測,這一基本觀點并不總是被視為理所當然的。20世紀的主流神經科學觀點将大腦的功能描述為一個特征探測器:大腦記錄刺激的存在,對其加以處理,然後發送信号來産生行為反應。通過特定細胞的活動來反映真實世界中刺激是否存在。例如,視覺皮層中的一些神經元會對視野中物體的邊緣作出反應,還有的神經元的放電則會訓示物體的方向、着色或陰影。

但事實證明,這個過程遠非看上去那麼簡單。進一步的試驗發現,比如,當大腦感覺到一條越來越長的線時,即使線沒有消失,針對線的探測神經元也會停止放電。事實上,有如此多的資訊似乎通過神秘的自上而下的回報連接配接來傳遞的,這表明實際上還有其他機制在發揮作用。

“如果大腦是一個推理機器、一個統計機構,那麼,大腦也會犯下和統計學家同樣的錯誤。”

倫敦大學學院 Karl Friston

這就是“貝葉斯大腦”(Bayesian brain)發揮作用的地方了,其總體架構可追溯到19世紀60年代。該理論提出,大腦會基于内部模型對現實世界進行機率性推斷,主要是計算關于如何解釋其感覺的“最佳猜測”(這個說法符合貝葉斯統計規則,該規則對基于先驗資訊得出的事件機率進行了量化)。大腦并不是等待感官資訊來推動認知,而是始終積極地建構關于世界運作方式的假設,并用這些假設來解釋經驗并填補缺失的資料。根據一些專家的說法,這就是為什麼我們可能會認為感覺是一種“受控制的幻覺”。

沿着這個理論,貝葉斯大腦也解釋了為什麼視幻覺會起作用:例如,兩個點在螢幕上快速交替閃爍,看起來就像一個點來回移動,是以我們的大腦無意識地開始像對待一個目标一樣對待它們。了解對象如何移動是一種更高層次的知識,但它從根本上影響了我們的感覺方式。大腦隻是填補某些資訊的空白,來繪制一幅不完全準确的圖檔。在本例中,就是關于運動的資訊,

DeepMind用深度學習模仿大腦推理,預測編碼智能推進一大步!

圖示為一個著名的視幻覺,棋盤上的格子A看上去比格子B暗得多。但是,其實二者的灰階是完全相同的。大腦會根據附近格子的顔色和圓柱體投下的陰影位置,對棋盤的顔色做出推測。在本例中,這種推測會産生格子A和B的顔色不同的觀點,而實際上,二者的顔色是完全相同的。(參考右圖,将A和B連在一起即可,若将圓柱體隐藏,看上去還會更明顯。)

但是,盡管生成模型和期望在大腦功能中發揮了明确的作用,科學家還沒有确切地确定這些機制在神經回路級别上是如何發揮作用的。蘇格蘭愛丁堡大學的心理哲學教授Mark Sprevak說:“貝葉斯大腦理論對于根本性的機制是相對不可知的。”

輸入預測編碼理論提供了大腦如何成為“貝葉斯大腦”的特定公式。“預測編碼”這個名字源于一種更有效地傳輸電信信号的技術:由于視訊檔案從目前幀到下一幀的過程中包含大量備援,是以在壓縮資料時,對每個圖像中的每個像素進行編碼是效率低下的。反之,對相鄰幀之間的差異進行編碼,然後進行反向處理來解釋整個視訊,這樣就更合理。

1982年,科學家發現這一理念在神經科學中有一個很好的應用,因為它似乎可以解釋視網膜中的神經元如何編碼關于視覺刺激的資訊,并将這些資訊沿着視神經進行傳播。該理論也被作為解釋大腦獎勵系統運作方式的原理:即多巴胺神經元會對預期獎勵與實際獎勵之間的不比對度進行編碼。研究人員表示,這些預測錯誤可以幫助動物對未來期望進行修正,并推動其決策過程。

盡管如此,科學家們大多仍将預測編碼視為特定網絡的特定過程。不過,功能磁共振成像測試和其他類型的實驗已經開始改變這一觀點。

通用架構

預測編碼假設如此引人注目,部分原因在于它具備令人難以置信的解釋力。“我覺得令人信服的是,在這個理論架構中,有不少事情都得到了解釋,”愛丁堡大學邏輯和形而上學教授兼理論專家 Andy Clark說。

首先,該架構在單一計算過程中統一了感覺和運動控制。這兩者基本上相當于同一枚硬币的兩面:無論是感覺還是運動控制,大腦都以不同的方式将預測誤差降到了最低。對于感覺來說,就是校正了内部模型。對于運動控制來說,就是實際的環境。(對于後者,可以想象一下,比如你現在想要舉手,如果這時你的手還沒有舉起來,那麼這種差異就會産生很大的預測錯誤。而你隻要把手移動一下,就把預測錯誤降到了最低。)

DeepMind用深度學習模仿大腦推理,預測編碼智能推進一大步!

迄今為止,在感覺和運動控制方面的實驗為預測編碼理論提供了最有力的證據。例如,在上個月出版的《神經科學期刊》上發表的一篇論文中,實驗者讓受試者在螢幕上讀“kick”這個詞,然後再讓他們聽失真的錄音朗讀“pick”。許多人将後者聽成了“kick”,功能性核磁共振掃描顯示,大腦對最初的“k”或“p”音表現出最強烈的反應 ,而這是與預測錯誤相關的音。如果大腦隻是表現出其感覺體驗,那麼最強的信号應該與“ick”相對應(因為它在螢幕上和音頻中都有出現)。

不過,有很多人在努力擴大預測編碼的應用範圍,将其擴充至感覺和動作領域之外,視為大腦中正在發生的一切的統一衡量标準。“這就像擁有可以建構不同政策的構模組化塊一樣,”Clark說。不同的大腦區域隻是對不同類型的預測進行交易。

Friston等人聲稱,這個理論也适用于更進階的認知過程,包括注意力和決策。最近關于前額皮質的計算工作表明,工作記憶和目标導向行為中也存在預測編碼機制。一些研究人員推測,情感和情緒也可以用預測編碼的術語來表達:情緒可能是大腦所表現出的用以實作内部信号(如體溫,心率或血壓)的預測誤差最小化的狀态。比如,如果大腦認識到自身的情緒激動,那麼也就知道了所有這些因素都在上升。也許這也就是“自我”的概念得以出現的原因。

DeepMind用深度學習模仿大腦推理,預測編碼智能推進一大步!

幾十年來,倫敦大學學院的神經科學家Karl Friston一直在完善預測編碼假設的關鍵原則。他認為,理論不僅可以解釋感覺,還可以解釋更高層次的認知過程。

以這種思路取得的大部分成果都集中在預測編碼對神經精神系統和發育障礙的解釋上。Friston說:“我認為,如果大腦是一台推理機器,一個統計機構的話,那麼它就會犯下和統計學家們相同的錯誤。”也就是說,大腦也可能會因為過于重視或過于輕視預測和預測錯誤,導緻得出錯誤的推論。

比如自閉症的特征可能就是,無法忽略與大腦的最低處理層級上的感覺信号相關的預測誤差。這可能導緻對感覺的關注,對重複和可預測性的需求,對某些幻想的敏感以及其他諸多影響。而對于與精神分裂症等幻覺相關的疾病來說,情況可能正好相反:大腦可能會過多關注自身對正在發生的事情的預測,而對與這些預測相沖突的感官資訊關注不足。(專家們很快就要提醒你,自閉症和精神分裂症太複雜了,不能簡化為一種解釋或機制。)

耶魯大學醫學院的臨床神經科學家Philip Corlett說:“其中最重要的部分是向我們展示了我們的心理功能是多麼脆弱。” Corlett實驗室的實驗在健康受試者中建立了新的“信念”,鼓勵他們對之前經曆的刺激産生幻覺。 (例如,在一項實驗中,科學家們讓參與者将某個聲音與某個視覺圖像聯系起來。當他們看到圖像時,即使實際上根本沒有聲音,受試者也會繼續聽到聲音。)研究人員正試圖解開這些看法是如何轉化為感覺的。通過這些研究,“我們認為有證據表明感覺和認知并不是那麼泾渭分明,”Corlett說。 “新的看法可以通過教學獲得,可以改變你原來的看法。”

但當時的證據還沒能證明他的結論,而現在可以了。

放大細節 仔細觀察

“實驗結果經常表明某個特定結果與預測處理理論相容,但該理論并不是對結果的最佳解釋,”Sprevak說。預測處理理論在認知科學中被廣泛接受,但“在系統神經科學領域,它仍然是個弱者。”瑞士弗裡德裡希·邁瑟生物醫學研究所的神經科學家Georg Keller說。他的實驗室正試圖用更确鑿的證據改變這一現狀。

DeepMind用深度學習模仿大腦推理,預測編碼智能推進一大步!

弗裡德裡希·米歇爾生物醫學研究所的神經科學家Georg Keller一直緻力于揭示預測編碼假設的機制性證據。

在去年在《神經元》期刊上發表的一項研究中,Keller和他的同僚觀察到小鼠視覺系統中神經元随着時間的推移會變得具有預測性。這個發現始于一場意外,當時他們在視訊遊戲中訓練老鼠,卻發現在虛拟世界的方向已經亂了。通常在實驗時, 老鼠左轉時的視野都會向右側移動,反之亦然。但有人無意中颠倒了研究人員在研究中使用的虛拟世界的方向,左和右翻轉過來了,是以小鼠左轉時的視野也向左移動了。研究人員意識到他們可以利用這次事故。他們監測了表現出這種視覺流動的大腦信号,結果發現随着小鼠學習倒置環境的規則,大腦信号也慢慢出現了變化。Keller說:“這些信号看起來像是對向左方向視覺流的預測。”

如果信号隻是小鼠視覺體驗的感官表現,那麼這些信号就會立即在虛拟世界中出現翻轉。而如果是運動信号,則根本不會翻轉。“實際上是識别預測,” Keller說。 “是對給定運動下視覺流的預測。”

“這項研究提供了一種以前未發現的證據,”克拉克說。 “這是一個非常局部的,逐單元、逐層的示範,說明預測編碼模型是目前最合适的模型。”

“在該系統中發現預測錯誤,并找到預測的具體内容是很令人興奮的,”該論文的第一作者、德國哥廷根歐洲神經科學研究所的神經科學家Caspar Schwiedrzik說。

德國馬普經驗美學研究所的研究員Lucia Melloni表示,她的團隊逐漸發現,這類實驗結果與目前從人類收集的神經中繼資料中的預測誤差的解釋一緻。

尋找更多預測機器的競賽

不是每個人都認為大腦預測編碼的理論正越來越強大。一些科學家同意這個理論可以解釋認知的某些方面,但不同意用它來解釋一切想法。也有人甚至連前者都不同意。對于紐約大學心理學教授David Heeger來說,重要的是要區分“預測編碼”和“預測處理”,他認為前者關乎資訊傳輸的效率,他将後者定義為随時間的推移而做出的預測。他說:“目前的文獻中存在很多混淆之處,因為這些東西都被認為是同一種湯的一部分。其實并不一定如此,現在的方式也不一定是最佳研究方式。”比如,其他類型的貝葉斯模型可能在某些情況下可以提供更準确的大腦功能描述。

然而,該領域的許多專家都認為,這項研究有可能激發機器學習的應用。目前,絕大多數人工智能研究都不涉及預測編碼,而是關注其他類型的算法。

但弗裡斯頓認為,在深度學習環境中制定預測編碼架構可以使機器更接近智能。

DeepMind的GQN就是發揮這種潛力的一個很好的例子。去年,蘇塞克斯大學的研究人員甚至使用虛拟現實和人工智能技術(其中包括預測編碼特征),打造了一台所謂的“幻覺機器”,這種工具能夠模仿通常由迷幻藥物導緻的幻覺狀态。

通過比較預測編碼模型與其他技術的表現,機器學習的進步可用于提供關于大腦中發生的事情的新見解。至少,将預測編碼引入人工智能系統可以明顯提高這些機器的智能水準。

但在此之前,我們還有很多工作要做。科學家需要繼續進行像Keller、Schwiedrzik等人正在進行的研究,格拉斯哥大學的神經生理學家Lars Muckli表示,預測性編碼“對于神經科學來說就像是進化對生物學一樣重要”,他對完善該理論做了大量工作。但就目前而言,Sprevak指出,“現有證據仍然不足以讓我們下定論。”

原文位址:

https://www.quantamagazine.org/to-make-sense-of-the-present-brains-may-predict-the-future-20180710/

原文釋出時間為:2018-07-19

本文來自雲栖社群合作夥伴新智元,了解相關資訊可以關注“AI_era”。

原文連結:

DeepMind用深度學習模仿大腦推理,預測編碼智能推進一大步!

繼續閱讀