天天看點

發表Nature封面論文「大腦語義地圖」之後的研究進展

2016年4月的《Nature》封面文章《 Semantic information in natural narrative speech is represented in complex maps that tile human cerebral cortex 》中,加州伯克利大學的  Jack Gallant 和他的團隊(Gallant 認知、計算和系統神經科學實驗室)終于成功繪制出大腦語義地圖(985 個英語常用詞彙語義)。我們可以清楚看到大腦如何根據更深一層的詞彙含義,将詞彙安置到諸如數字、地點或其他基于共通主題的子類别當中。

發表Nature封面論文「大腦語義地圖」之後的研究進展
2016年5月26日(當地時間), 腦科學領域的頂級峰會 Brain Forum 2016  在瑞士洛桑的瑞士科技會議中心舉行,腦科學領域的世界級專家、研究者、工程師、醫療健康專家、創業企業家、産業專家和投資人集聚一堂,共同探讨如何将腦科學轉變成觸手可及的解決方案。
發表Nature封面論文「大腦語義地圖」之後的研究進展
機器之心是唯一一家獲邀參會報道的中國媒體。會議期間,機器之心記者趙雲峰專程采訪了也來參加這次峰會的 Jack Gallant 教授。
發表Nature封面論文「大腦語義地圖」之後的研究進展

采訪開始

機器之心:在發表了論文《Semantic information in natural narrative speech is represented in complex maps that tile human cerebral cortex》之後,您的團隊開始探索新的地圖(atlas),大腦如何儲存語言其他方面的資訊,比如句法(syntax),目前在這些方面上有什麼新進展?

發表Nature封面論文「大腦語義地圖」之後的研究進展

Jack Gallant:用 Moth 的故事( The Moth Radio Hour,也就是 Nature 封面研究中使用的故事——編輯)做完上次研究後,我們給所有其他水準的信号進行了模組化,包括音素(phonemes)、詞素(morphemes)、句法(syntax)、語義等。我們沒有做叙述,因為給叙述模組化過于争議,目前還沒有統一标準。

語義目前是探讨的最廣泛的話題,最容易發表這方面的文章,是以我們将這方面的論文發表了。這周我們還會發出另一篇論文,主要關于句法、音素等。結果要幾個月後。這項研究和之前的研究是一回事,隻不過針對的是不同信号特征。

處理這些對象的難點在于,它們發生時間都是很短的,而功能性磁共振成像更善于記錄發生速度慢的資訊,對于快速發生的事件效果很差。是以,盡管我們能夠選擇其它特征來進行模組化,但是它們并不都是效果最好的。

機器之心:你們繪制完成的地圖,讓我們看到大腦不同區域如何表征 958 個常見英語詞彙意義...

Jack Gallant:  我們選取了英文中最常用的 985 個單詞,并嘗試在一個含有 60 億單詞之多的語料庫中,尋找它們之間的關系。這個過程與語義分析很像,是一個共向變量空間。    是以這些特性是詞義上(meaning)的特性,它更像是詞義連成的關系網,其中每一個詞義都能夠通過其與附近詞義的關系推導得出。

機器之心:下一個研究目标是什麼?

Jack Gallant:我們近期快要完成的是一項比較聽力與閱讀過程的實驗,例如,同樣一個故事,你可以通過閱讀文字和圖檔的形式了解,也可以通過聽音頻的方式。但是,二者的語義地圖幾乎是一樣的。另一個我們感興趣的主題是雙語現象(bilingualism)。拿漢語和英語舉例,我們的語義空間是一樣的嗎?我們的語言空間自然是完全不同的,是以我對漢語的語義一無所知。在雙語研究上,最有趣的組合可能是漢語與任意一種歐洲語言,因為它們在語言學中屬于兩種完全不同的分支,許多意群的發展形式也是完全不同的。目前我們主要重心在英語和漢語上,未來也可能比較英語和西班牙語,等等。

機器之心:你認為你們的研究成果會給人工智能領域一些靈感,讓機器學習表現更好嗎?

Jack Gallant:谷歌翻譯很贊!在實驗室我們大量地使用人工智能應用,如獲得事物特征等。我們會将自然語言處理應用到故事上。例如,當你玩電腦遊戲的時候,遊戲中的所有你能看見的、你的目标等等資訊,都一定能夠在你的大腦中被表現,但是我們怎樣才能知道這些特征是什麼?

有一種你能想象的方法是,我們幹脆讓一個人工智能來玩這個遊戲,然後讓其内部顯現的特征帶入到大腦中。是以,我同時也感到,因為我們對大腦的認知如此有限,是以其實很多時候我們是将人工智能上的資訊應用到大腦上,而不是将大腦上的内容轉移到人工智能上。

另外,有一點我認為值得讨論的是,近期大熱的神經網絡其實也隻是受人類大腦的啟發而已,而并非高度的模仿。因為在大腦中的神經網絡裡,資訊是雙向流動的,前饋與回報是并存的,如果你完全關閉了回報的通道,整個系統就會崩潰。然而在計算機領域的神經網絡中,資訊是單向流動的,也就是隻有正饋。是以,我相信,這種含有正回報的動态的神經回路機制會在計算機領域變得十分重要。

機器之心:你的研究很棒,看起來就像一個平台,未來這個平台會向其他人,比如科學家、研究人員開放嗎?

Jack Gallant:會的。我們希望人們了解我們在做什麼。SPM 是一種進行功能制圖的傳統工具,在使用 SPM 的時候,你必須先獲得平滑資料。但是将資料平滑化的原因不是因為這樣對資料好,而是因為這樣使得統計參數圖在統計意義上更具有合理性。這種做法事實上對研究是有害的,因為在這一過程中,為了使統計方法運作良好,你事實上丢失了很多資訊。而在我們的架構中,你不需要平滑資料,除非你必須這麼做。我們希望更多人能有機會使用這一平台,但我們可能不會自己提供軟體上的支援。目前,我們會一點點地開放。但是像 Brain Viewer 這樣的工具已經是完全開放的了,任何人都可以在上面對大腦結構進行剖析和觀察。你可以直接到 GitHub 下載下傳。

在學校内部,我們也将我們的軟體開放給伯克利的情緒研究室的研究人員們,他們能夠使用我們的軟體和系統完成自己的實驗。此外,我們也正在和加州理工的實驗室進行合作。

機器之心:您這項研究的最終目标是什麼?您希望能在多大程度上了解大腦了解語言的方式?

Jack Gallant:語言隻是作為人類的一個組成部分,當我們在做功能性磁共振成像語言實驗的時候,我們不是在了解語言,而是試圖了解大腦是如何了解語言的。我認為這二者是不同的,是以我更關注的是研究大腦是如何了解語言的。是以我們努力在做的唯一一件事情是,将大腦所有區域中的所有資訊還原出來。假設有 500 個在運作的大腦區域,其中每一個區域代表 15 個次元(dimensions),那麼現在我們就很清楚有 7,500 個次元是我們需要還原的,那麼我們就有了大腦中全部 7,500 個次元的資訊。而這些隻是名義上在不同大腦空間中被轉譯的資訊,其中還有很多子空間,我們現在在座的就是盡可能多地将這些資訊還原。

機器之心:假如我們完全了解了大腦對語言的了解機制,未來我們是否有可能實作無需對話,而直接在人腦間進行交流?

Jack Gallant:這個問題很有意思,我想這最終是可能會發生的。但是,現在我們還有很長的路要走。可能很多人小的時候都有這樣的經曆:你将收音機拆開試圖了解它的工作原理,然後你發現其中一個回路是調節音量大小的——可能電壓越大音量越大。下一次,當你覺得音量太小的時候,你會嘗試增加電壓,而這可能導緻整個收音機直接報廢了。了解一樣東西總是比修改一樣東西要容易得多,大腦也是這樣。即使我們能夠很好地掌握大腦了解語言的機制,但如果真要實作大腦間直接的交流,我們需要在大腦中植入外部工具,甚至是改變大腦的結構,而一點點細微的差錯或噪音就可能産生難以預料的後果,是以我想實作這一點,我們還需要很長一段時間。

采訪結束

Jack Gallant:你竟然穿着我們死對頭(斯坦福)的T恤采訪我。(玩笑)

機器之心:Go bears!

繼續閱讀