要不要先驗？怎麼看混合模型？Marcus和Bengio激辯AI未來

兩個人想要讨論的焦點是：「符号處理和因果關系與目前 AI 發展方向之間的關系。」

最近在「風口浪尖上」的 Gary Marcus 是一名成功的科學家、暢銷書作家、企業家，以及 Geometric Intelligence (被優步收購的機器學習初創公司) 的首席執行官和創始人。作為一名作家，他經常為《紐約客》和《紐約時報》撰稿，并且是四本書的作者。作為紐約大學心理學和神經科學教授，他在人類和動物行為、神經科學、遺傳學和人工智能等領域發表了大量文章，并經常刊登在 Science 和 Nature 等期刊上。

而在另一邊，Yoshua Bengio 則是最近一次計算機科學最高獎項圖靈獎的獲得者，以及 2020 年的 AAAI 當選 fellow。他目前任蒙特利爾大學教授、魁北克人工智能機構 Mila 的科學主管。Bengio 和 Geoffrey Hinton、Yann LeCun 一直被認為是深度學習先驅。正是他們在三十年以前發展了深度學習概念基礎，進而引領了最近一次 AI 技術的爆發。12 月 21 日，Bengio 和 LeCun 又雙雙入選 2020 AAAI Fellow，這是對他們長期以來堅持深度學習研究和應用的一種肯定。

總體觀察來看，兩方争論的焦點在于符号處理（symbol manipulation）和因果關系與目前 AI 發展方向的聯系。Gary Marcus 認為，符号處理對于因果關系至關重要。在人類等進階生物中，人們發現了很多分工不同的大腦區域。期望複制完整的體系結構是非常不現實的。

Yoshua Bengio 等人認為，我們可以在保持深度學習架構的同時加入因果推理，新的人工智能系統或許可以利用注意力機制，或者通過新的子產品和訓練架構來實作（例如元學習和基于智能體的方式）。

将因果關系引入深度學習會對通用人工智能帶來切實和持久的貢獻，但是利用單一架構來擷取所有的認知是否現實？

Bengio 和 Marcus 都認為，雙方共識和分歧的表達或許會為人工智能領域帶來益處。

辯論首先由雙方介紹各自的觀點，然後開始根據提出的問題進行自由辯論，最後還有回答現場和網上提問的環節。

Gary Marcus：我沒說深度學習沒用，但是需要結合符号建構混合系統

由于長期以來對深度學習的批判，Gary Marcus 一直飽受争議。在論點陳述階段，為了讓大家更好地了解自己的真實立場，Marcus 首先回顧了自己近二十多年對于深度學習的觀點和态度。這些觀點包括：

承認混合模型（符号處理和模式識别都包含在内）的價值；
認識到外推（extrapolation）的重要性及純深度學習系統的弱點；
認識到組合性（compositionality）的重要性；
認識到捕獲和表征關系的重要性；
認識到因果的重要性；
認識到記憶的重要性。

接下來，Gary Marcus 澄清了 Bengio 及其他人關于自己一些觀點的誤讀，如「深度學習無用論」。

我從未說過「深度學習無用」

Gary Marcus 澄清的「深度學習無用論」主要是指最近 Bengio 在接受 IEEE 采訪時所提到的内容。Bengio 在采訪中曾經說道，「一些人（如 Gary Marcus）表示「看啊，深度學習沒用。」但事實上，像我這樣的研究者正在做的是擴充深度學習的邊界。」

Gary Marcus 在辯論中澄清，「我從未說過深度學習無用，隻是說深度學習不是唯一的選擇」。

他還表示，自己與 Bengio 的觀點分歧其實主要集中在後者早期的（如 2014-2015）的一些觀點，比如：1）過度信任黑箱深度網絡；2）過度依賴大型資料集；3）過度看中淺層的深度學習系統，對其他方法缺乏興趣。

其實，随着深度學習缺點的逐漸暴露，Bengio 也已經意識到，單純依賴深度學習不可能解決所有問題。

Bengio 在今年的 NeurIPS 大會上做了題為《FROM SYSTEM 1 DEEP LEARNING TO SYSTEM 2 DEEP LEARNING》的報告，指出人的認知系統包含兩個子系統，一個是直覺系統（System1），主要負責快速、無意識、非語言的認知，這是目前深度學習主要做的事情；另一個是邏輯分析系統（System2），是有意識的、帶邏輯、規劃、推理以及可以語言表達的系統，這是未來深度學習需要着重考慮的。

是以，現在雙方争論的焦點其實已經不是深度學習有沒有用，而是往裡面添加什麼東西來建構一個更智能的混合系統。

深度學習需要加入符号處理

在建構混合系統方面，Gary Marcus 認為，深度學習應該結合符号處理。

符号主義和聯結主義的争論由來已久。在深度學習的潛力被挖掘之前，符号主義一直占上風。但随着深度學習的火熱，人們對聯結主義的追捧似乎也已經過了頭。Gary Marcus 認為，深度學習火了那麼久，缺陷也暴露無遺，是時候把符号處理加進來了。

但讓 Marcus 疑惑的是，Bengio 似乎對符号主義的東西不太感興趣。他甚至在給學生的一封信中寫道：「你提出的是神經符号混合系統，這個系統行不通，幾代研究者都做過嘗試，而且都失敗了。」

對于這種悲觀的态度，Marcus 反駁道，「如果要反對符号處理，那你就需要證明你的系統沒有用到符号」。在他看來，Bengio 并沒有做到這一點。

Marcus 還反駁了 Bengio「人類大腦就是一個神經網絡」的觀點（下文中會提到）。他認為，現在的人工神經網絡過于簡單，如每個神經元隻有一個自由度，而且同質化嚴重。

Gary Marcus 認為，「人類大腦就是一個神經網絡」這一觀點淡化了一個假設，即大腦有可能在算法層面是符号的，在實作層面是神經的。對于「符号在生物層面是不可行的」，Marcus 認為這種觀點非常荒謬。他表示，這個問題的焦點不應該在于大腦有沒有用到符号，而是在多大程度上利用了符号。

對于這個假設，Gary Marcus 表示，退一步說，即使大腦本質上是一個神經系統，AI 也不應該将符号排除在外。首先，目前還沒有正式的證據表明符号無用；其次，符号已經在一些領域發揮了作用，比如谷歌的搜尋引擎。谷歌使用的是深度學習+知識圖譜的方式進行搜尋，而且已經證明比單獨使用二者的任何一個效果都要好。

Yoshua Bengio：我比較關心怎麼做出 System 2

Bengio 在觀點陳述階段并未花費很多時間正面評價符号主義或 Marcus 的論點，而是具體介紹了深度學習發展中遇到的問題，以及他所認為的一些解決方法。

具體來說，Bengio 更關心的是如何更新深度學習，即 System 2 需要添加哪些東西。

System 2 需要重點關注 OOD，關鍵是注意力和意識

Bengio 認為：

傳統的機器學習都是基于 IID（獨立同分布），但 OOD（out of distribution）才是下一步的重要挑戰；
注意力機制和意識先驗都是 System 2 的關鍵要素。

Bengio 在 NeurIPS 的報告中也表達了類似的觀點，唐傑老師對報告進行了解讀。

Bengio 在報告中指出，現實世界中我們感興趣的資料往往不是 IID 的，而是 OOD（即出現次數非常少），是以我們在處理時應該更加關注 OOD，也就需要在機器學習算法中建立新的資料假設。我們需要考慮哪些因素會影響資料分布的變化，以及不同分布的可組合性等方法如何對現在的 IID 和 OOD 進行泛化。而元學習則是可能實作機器學習到 OOD 和模型快速遷移的一個辦法。

而對于建構 System 2 來說，基本的要素包括：注意力和意識。

注意力（Attention）實際在目前的深度學習模型中已經有大量的實作和探讨，比如 GAT（圖注意力機制）等；

意識最關鍵的是定義到怎樣的邊界。Bengio 提到意識先驗可以使用稀疏因子圖模型來實作。稀疏因子圖可以用來學習變量之間的因果關系，進而構造變量之間的因果關系。

基于規則的傳統符号處理有很多問題

對于 Gary Marcus 提到的在下一代深度學習系統中加入符号主義，Bengio 表示，傳統的基于規則的符号處理 AI 存在很多問題，包括：

需要高效、協調的大規模學習；
和 System 1 一樣需要語義落地（semantic grounding），還需要感覺動作循環（perception-action loop）；
需要用于泛化的分布式表征；
像 System 1 一樣需要高效搜尋；
需要處理不确定性

同時，Bengio 指出，他們要建立的下一代深度學習系統絕不是簡單地将好的老式人工智能（Good Old-Fashioned Artificial Intelligence）與深度網絡相結合。原因在于：

System2 和 System1 一樣需要學習；
高度抽象的概念需要「落地」，通過機率分布表示來實作泛化性；
系統需要表示出不确定性；
暴力搜尋算法并不能擴充，而人類似乎是使用潛意識（System 1）處理并引導搜尋，包括推理。是以 System1 和 System2 應當是緊密結合的；
我們的大腦都是神經網絡；

這些論點無疑反駁了 Marcus 對于在人工智能系統中引入符号計算的觀點。之後，雙方根據現場觀衆和線上留言提出的問題進行了解答。包括如何在深度神經網絡中引入先驗，應當引入什麼樣的先驗知識。所謂的「人工智能的潛意識」指的是什麼。最終，辯論以友好但誰也沒說服誰的的方式結束。

輿論評價

對于這次辯論，輿論普遍認為：雙方普遍軟化了彼此的立場，進而淡化了争論中的火藥味。然而，關于未來人工智能發展的路線和理論趨勢，誰也沒有說服誰，更遑論得出一個令人信服的結果了。

Reddit 網友：立場軟化、難以信服

Reddit 上的網友對本次辯論的評價說：

「雙方并沒有真正在辯論，甚至沒有沖突。他們都沒有站在一個堅定的立場上。在談到細節上時，雙方都以一個安全的立場結束，去同意對方的一些觀點。」

另一位「Bengio」評論說：

「本次辯論沒有赢家，因為雙方都有令人信服的論點。一方面，Bengio 對于人類大腦從生物學處理的噪聲頂端意識到符号推理的觀點是正确的。而另一方面，Marcus 認為在可學習的智能體中部署寫死的符号算法可以提升泛化性和樣本複雜度。這是到達人類級别人工智能的正确路徑。

時間會給我們答案。」

ZDNet：對術語有分歧，似乎在各說各話

科技媒體 ZDNet 也對本次辯論進行了報道，ZDNet 認為雙方在術語上有一些了解的分歧。各方從自己的表述中出發提出論點，而某些表述在對方看來有着不同的了解。

以符号為例，Marcus 在辯論中認為，AlphaZero 等類似的 AI 使用的就是符号系統。因為其采用的是蒙特卡洛樹搜尋，「對于樹的追蹤和搜尋難道不是符号嗎？」而 Bengio 則認為這不是符号，「符号必須能夠區分概念。」

同樣在先驗問題上出現了用詞的分歧問題。Marcus 批判了 Bengio 想要讓神經網絡抛棄先驗的想法，而 Bengio 則辯護說，自己隻是想讓先驗更少一點，最好是元先驗（meta-prior），對此 Marcus 認為這和自己希望給 AI 加入先驗沒什麼不同，隻是多少的差別。

當然，Marcus 也改變了一些觀點。例如，他談到說不能将神經網絡和人腦的神經系統類比，因為大腦神經元之間有很多可以被塑造的「軟連接配接」。Bengio 很快駁斥說，神經網絡中的門「Gate」控制就是這樣一種軟性的連接配接。Marcus 随即表示同意，終結了這個問題的讨論。

ZDNet 文章總結說，本次辯論的雙方都是從各自的立場出發，介紹了自己的一些想法。Marcus 談到的是人工智能應當是什麼樣子的，并以人類的認知方式為例，認為人工智能應當效仿人類的認知方式達到真正的智能。而 Bengio 則更多從實際出發，介紹現有的實驗和工作，講明以我們現在的技術，如何才能讓目前的 AI 系統克服缺點。

總而言之，本次辯論無疑對符号主義和聯結主義之間的争論進行了一次系統性的梳理和總結，更像是一次意見的交換。盡管大佬們的争論并沒有達成最終的共識，但是我們可以了解到：人工智能并非隻有深度學習一家，對于達成類人人工智能的路徑也可能極為不同。深度學習并非最終道路，而先驅們已然孜孜探索。

以下是完整版視訊：

點選檢視視訊

辯論從1小時40分鐘左右開始，請拖行進度條觀看。

官方視訊連結：

https://www.facebook.com/MontrealAI/videos/498403850881660/

參考連結：

https://www.jiqizhixin.com/articles/2019-12-16-4?from=synced&keyword=ood https://www.zdnet.com/article/devils-in-the-details-in-bengio-marcus-ai-debate

機器之心「SOTA模型」

：22大領域、127個任務，機器學習 SOTA 研究一網打盡。

要不要先驗？怎麼看混合模型？Marcus和Bengio激辯AI未來

繼續閱讀

開源低帶寬語音編解碼器

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希