算法周刊·前沿掃描｜對話董樂：小資料為何熱門？如何思考通用人工智能？

“小資料”逐漸熱門，背後是技術演進的自然結果還是“大資料”碰壁後的重新選擇？認知智能世界裡的“暗物質”是什麼？我們該如何期待和思考通用人工智能？

“我們是世界上比較早研究大資料問題的團隊，差不多在17年前（2004年）就開始做大資料領域的研究。研究了大概三四年以後就發現大資料存在一些固有的問題，當時預見到這些問題用感覺智能是無法解決的。後來我們就開始嘗試範式轉換，從2009年開始研究認知智能。”近日，北京通用人工智能研究院常務副院長董樂接受澎湃新聞（www.thepaper.cn）采訪時表示。

北京通用人工智能研究院定位為非營利性的新型研發機構，由北京市政府、科技部支援共建，北京大學、清華大學等機關合作支撐，由全球著名計算機視覺專家、統計與應用數學家、人工智能專家朱松純教授于2020年籌建并擔任院長。其目标是實作具有自主的感覺、認知、決策、學習、執行和社會協作能力，符合人類情感、倫理與道德觀念的通用智能體。

董樂闡述道，目前大家看到比較多的AI采用的是“大資料+算力+深度學習”範式，屬于感覺層的智能，在真正産業落地時，目前的感覺智能遇到了很多問題，比如隻能做特定的人類事先定義的任務，存在長尾效應、訓練成本高的問題，大量資料标注牽扯到隐私與安全性問題，此外還存在模型的不可解釋、不能交流、算法偏見等各種問題。

“現在大家慢慢形成了共識，認知智能可能才是下一個10年人工智能要重點發展的方向。”董樂教授表示。

怎麼了解認知智能與感覺智能？

“烏鴉範式”和“鹦鹉範式”

日本一位野生動物學家采集了野生烏鴉的很多日常生活習性視訊。他發現，當野生烏鴉來到城市，它需要堅果飽腹但又沒有辦法打開堅果。這時，它有個很偶然的發現，把堅果扔到路上，汽車開過去後堅果被碾碎了，就可以直接過去吃。

但它在去吃的過程中又面臨一個新問題，馬路上很危險，它要怎麼完成這個任務？很聰明的是，它又發現信号燈，當紅燈的時候，所有車都停下來，它就把堅果扔到斑馬線上，堅果被車輪碾破，等信号燈訓示，車都停了再下來把堅果吃了。

“所有這一系列動作都是它自主完成，通過要解決一個任務——安全吃到堅果，它進行了觀察、推理，發現了交通的規律，然後去執行和決策。我們把這稱之為‘烏鴉範式’，即“小資料，大任務”範式。它沒有很高的訓練成本，也不需要太多的資料訓練，但它要完成一個任務目标，是以它是由任務驅動的。”董樂說道。

與“烏鴉範式”相對的就是“鹦鹉範式”，鹦鹉需要大量的資料反複訓練，教給他什麼它就說什麼。它可以不斷重複，但并不了解其中含義，它不能反映現實中的因果邏輯，是“大資料，小任務”範式。

在認知智能視野下，人工智能系統的三個關鍵要素是“架構、任務和資料”。董樂認為，相比于感覺智能所強調的“資料、算力和模型”，這是又向前演進了一步。其中，架構最重要。“就像判斷一個人的能力，并不是來自他掌握了多少知識，而是他有很完整的知識構模組化型能力，那麼即便目前擁有的知識不夠多，但到一個新的領域，有了這樣健全的架構也可以迅速習得新知識。我們認為架構是基礎，任務是關鍵，在這個過程中資料起了一部分作用，但并不是全部的作用。”

比如訓練AI完成椅子識别的任務。如果按照感覺智能深度學習的範式，需要把大量椅子圖像中的特征标注出來，再讓AI學習。但此後，遇到異形的椅子，依然會出現難以識别的情況。“不光是單純的物體識别，在包括無人駕駛和醫療等領域，都會遇到類似的問題。”董樂表示。

但人不需要看過很多椅子也很容易做出是否是椅子的判斷，人是如何做的呢？

董樂概括道，“我們人會把這個任務從單純的物體識别問題上升到對任務的了解的高度。通過視覺感覺和實體想象進行判斷，也就是說我們看到它，就可以想象它能不能承受讓我安全地坐，以及坐上去舒不舒服，就這麼簡單。”

董樂曾在BEYOND國際科技創新博覽會的論壇中提到認知智能世界裡的“暗物質”。她認為，在日常生活中，我們很容易感覺到視覺等感官的資訊輸入，但這隻是冰山一角。“在感官背後的推理、想象其實發揮了巨大能量，我們将其稱作‘智能暗物質’。我們會對實體和社會常識進行了解、推理，然後結合時空、因果模型作用在現實場景中，把感覺和認知進行融合。”

AI可以學習人類這種把看不見的知識提煉出來的抽象能力，基于這樣“Dark Beyond Deep”的範式轉化，即通過少量資料完成“大任務”，以少量樣本、簡單标注，做到舉一反百，以感覺智能和認知智能相結合的方式來了解世界，探索智能“暗物質”。

對于“小資料”逐漸熱門，背後是技術演進的自然結果？還是“大資料”碰壁後的重新選擇？董樂認為，兩個層面都有。

“我們不否定大資料，大資料在很多場景上确實有很大價值，但是在另外一些場景上怎麼辦？同時還有資料問題，成本問題，能耗問題……用大資料去解決一些根本不用大資料就能解決的問題，其實是非常不科學的。”董樂對澎湃新聞（www.thepaper.cn）表示。

如果粗略對比鹦鹉範式烏鴉範式的效能，董樂說道，“鹦鹉範式可能是2:8，即通用能力大約隻有20%，還需要按任務要求對80%的能力進行個性化定制；烏鴉範式則是8:2，通用能力達到80%，隻有20%的能力需要按任務要求進行優化疊代。”

對于是否認可人工智能前進道路中類腦智能的研究路線，董樂對澎湃新聞（www.thepaper.cn）談到，“如果抛開要解決的問題和任務，單純讨論一個技術範式或者說一種路徑，我認為意義和價值都不大。每一條技術路徑都有它探索和研究的某種必要性，單純去說哪條路徑可能有問題，或者有人有質疑，這都不足為奇，關鍵的是要解決什麼問題，要把任務确定好。”

董樂以登山做比喻，從山腳往山頂有很多路，周圍的風景也不同，過程中要解決的問題也不一樣，現在從山底下往上看的時候，沒有辦法去評判哪條路是最好的。可能隻有真正到了上面以後，再回過頭來思考這個問題。

通用人工智能是像人一樣的“人造智能”嗎？

2014年，實體學家斯蒂芬·威廉·霍金（Stephen William Hawking）在接受英國廣播公司（BBC）采訪時曾表示了對一個“像人”的人工智能的擔憂，“制造能夠思考的機器無疑是對人類自身存在的巨大威脅。當人工智能發展完全，就将是人類的末日。”

此後幾年，霍金也在多次演講中表達了這樣的看法。2017年，霍金在接受英國《泰晤士報》采訪時更是發出警告，“人工智能進一步發展便可能會通過核戰争或生物戰争摧毀人類。人類需要利用邏輯和理性去控制未來可能出現的威脅。”

那麼在當下，我們在讨論通用人工智能時指向的是霍金所擔憂的人工智能嗎？

中國科學院院士、清華大學人工智能研究院院長張钹曾在第五屆中國人工智能大會上表示，“通用人工智能的發展是好事，真發展出來了也是喜事，但是這裡不能把通用人工智能和強人工智能混淆。”

南京大學人工智能學院院長周志華曾在《中國計算機學會通訊》2018年第1期《專欄》裡将“強人工智能”描述為，達到甚至超越人類智慧水準的人造物，具有心智和意識、能根據自己的意圖開展行動的“人造智能”。“通用人工智能”則是希望借鑒人類的智能行為，研制出更好的工具以減輕人類智力勞動，其實質是行為智能和任務智能，本質還是“弱人工智能”，類似于“進階仿生學”。

“人工智能技術現在所取得的進展和成功，是緣于‘弱人工智能’而不是‘強人工智能’的研究”，周志華稱，“從技術上來說，主流人工智能學界的努力從來就不是朝向強人工智能，現有技術的發展也不會自動地使強人工智能成為可能。”

國際人工智能聯合會前主席、牛津大學計算機系主任邁克爾·伍德裡奇(Michael Wooldrige)曾在2016年CCF-GAIR大會報告中說，強人工智能“幾乎沒有進展”，“幾乎沒有嚴肅的活動”(little progress, little serious activity)。

“通用人工智能是根據任務驅動，目前在有限邊界内進行的，就像我們人一樣，人的能力也是有邊界的。”董樂對澎湃新聞（www.thepaepr.cn）表示。

什麼樣才能達到真正所說的通用人工智能？董樂認為，實際上是一個使命，一個方向，它不斷讓智能體以更加通用化的方式解決問題。第一個展現是，智能體能夠具備普遍意義上的常識推理能力，大概百分之八九十的任務都能做到準确了解、并能實作。第二是一項技術基本在具有同樣邏輯的場景中都能通用。

“例如在醫療、教育、金融，包括能源等領域都有大量的資源比對的問題，決策者需要根據有限的資訊實時做出預測，是以分析光快不行，要準确，準确以後還要全面，要分析出原因，這樣才能更清晰更合理，”董樂表示，“我們的認知AI通用智能體，它起到的作用實際上就是把這些綜合的資訊，更合理化地給到需要的人手裡，幫助決策者，更好、更公平地統籌、配置設定資源，做出最科學的決策。”

在當下，很多企業也在借助人工智能完成智能化轉型。記者走訪中發現，對于要不要自建AI團隊，很多轉型中的企業是有猶豫的。 “目前會看到很多國家企業也都面臨這樣的問題，一個是資料能不能給，第二是自己的專業能力能不能夠。”董樂對澎湃新聞（www.thepaper.cn）表示。

董樂認為，“如果隻是一個企業的應用，應該去跟專業團隊合作。AI人才本身很緊缺，成本很高，如果沒有很強的科學研究和工程化能力，最後會發現投入越來越多但産出不明顯。如果從企業戰略層面考慮要布局自己的AI團隊，這是另外一個問題。單純從結果的産出導向來說，我認為對于大部分的企業來說沒有必要組建自己的專業AI隊伍，找到一個優秀的專業團隊，搭建好的合作模式，各自做各自擅長的事才是最優解。”

談到AI對人類和社會福祉的幫助，董樂表示，實際上就是用技術的方式打破不平衡的、可能帶來浪費和損耗的資源配置設定方式，使社會整體的運轉效率得到智能化提升。“我們認為在未來50年必将産生人工智能與人類文明的碰撞與融合。其實對所有社會治理者，包括我們每一個人都要去思考，智能時代的社會，我們要去面臨什麼？”

算法周刊·前沿掃描｜對話董樂：小資料為何熱門？如何思考通用人工智能？

繼續閱讀

裡程碑式的突破！阿裡巴巴再次證明，中國人工智能并不落後

新聯考一卷作文引争議，網友：農村孩子不懂人工智能，有失公平

聯考作文，網際網路、人工智能、嫦娥探月，題目真的很新，緊跟時事！#2024聯考作文彙總#

亞洲人工智能峰會2024圓滿落幕：亞洲AI發展開啟新的裡程碑

不公平！聯考作文題目：人工智能與AI，網友：這不是坑農村孩子嗎

今年聯考作文被網友指責歧視農村孩子，人工智能根本不會寫！

人生沒有标準答案！Al人工智能的間題，在過于标準化的問題！

投資人工智能，下一個百萬富翁就是你！美60萬名百萬富翁是以産生

#頭條創作挑戰賽#Gai是現在人工智能追求的目标,也是現在人工智能的本質，知識庫的建立,不能像行業知識庫一樣，一個行業就

新一卷作文題的人工智能隻是一個幌子，懂太多可能會跑題

WWDC24：蘋果人工智能上線，Siri與ChatGPT整合惹怒馬斯克

人工智能是時代進步的産物，到底是人類的幸福還是悲哀呢？

這款真是太可愛啦！2024年最新款的電動智能機器狗，不僅造型逼真，還有八輪設計，靈活自如！男女孩都會喜歡的禮物，是親子互

餐廳裡機器人炒菜，送餐，替代廚師和服務員；家裡和路上，機器人掃地，替代家政和清潔工；工廠裡自動化生産線，替代掉大量的流水

美政府被曝正考慮再出招限制中國擷取用于人工智能的晶片技術，中方此前已表态

數學到底有多重要，看官媒給你科普。與航空航天，國防安全，生物醫藥，海洋，人工智能，資訊，能源，先進制造的聯系越來越緊密。