機器學習創始者、AAAI 前主席Thomas Dietterich：AI發展四大挑戰 (35PPT)

【人物簡介】thomas g. dietterich 是機器學習領域的創始人之一。他的研究貢獻主要包括将糾錯輸出編碼（error-correcting output coding）應用于多類分類問題，發明了多執行個體學習（multiple-instance learning）、層次強化學習 maxq 架構，以及将非參數回歸樹整合到機率圖模型中的方法（包括條件随機場和潛變量模型）。著作包括《人工智能手冊》（handbook of artificial intelligence）第十四章（學習和歸納推理）、《機器學習讀物》（readings in machine learning，與 jude shavlik 共同編輯），以及他經常被引用的評論文章 machine learning research: four current directions and ensemble methods in machine learning。

此外，dietterich 教授也參與撰寫了白宮日前推出的兩份重磅 ai 報告《為人工智能的未來做準備》和美國《國家人工智能研究與發展政策規劃》。

機器學習創始者、AAAI 前主席Thomas Dietterich：AI發展四大挑戰 (35PPT)

thomas dietterich：我非常榮幸跟大家來談人工智能這個話題，來談它的進步和進展。我最近的一些工作是在 aaai（美國人工智能協會）——aaai 是在美國成立的組織，它在加拿大以及全球都有發展，我鼓勵大家每個人都成為 aaai 會員，它的會費非常低，還不到 20 美金一年。我們和中國的計算機協會以及中國自動化學會的合作是非常緊密的，聚集在一起，大家都能夠在人工智能領域有一個全球性的讨論。

人工智能或者說軟體如果足夠智能，就能了解一些事情。整個軟體的結構是什麼？它的範疇是什麼？我們發現，人工智能有着非常深遠的影響，它能夠看到，也可以選擇行動，取得目标，比如 alphago 或者自動駕駛的汽車都是這樣的。

令人激動的現在：ai 在感覺、機器翻譯、個人助理等領域的成果

人工智能也包含學習，從經驗中、從訓練的資料中學習，我希望人工智能未來也能夠以不受監督的方式來學習。計算機和人工智能的系統不是獨立存在的，也需要和其他的人和系統互動。2013年，語音識别的正确率大概是 20%，之前在語音識别裡面有很多進展，但是錯誤率也很高。人們做了很多很多的工作，但是錯誤率還是降不下來。但是，使用深度學習以後，文字識别錯誤率降到了 8%，今天的錯誤率降到和人類一樣，有些時候甚至比人類還好——比如微軟的圖像識别系統。

還有一個很好的例子，就是 google 可以進行圖像的識别和翻譯，比如把圖像放到這裡，圖中的中文能夠被自動翻譯為英文。還有伯克利實驗室做的一項研究，在椅子上有毛色黑白相間的貓，我們用手機攝像頭可以看到這裡有不同的圖像，ai 可以在上面有一些英文的句子出來。

在之前的演講中也說到了機器翻譯，skype 翻譯就是一個例子，我們現在可以實作一個夢想，這個夢想已經有很多年了，那就是人們可以在全世界各個地方交流，不管說什麼語言，隻需要有 skype 這樣的軟體就可以了。全世界主要使用的有 50 多種語言，不管我們說什麼語言，通過 skype 就可以同其他人正常的溝通。

deep learning 是一個很好的話題，但是人工智能在很多方面都有令人興奮的進步和發展。在計算機科學方面有一些限制，比如 a 和 b 需要是真實的，這樣的邏輯模型。要是給你很多的限制條件，每個變量都受限制，那還能夠實作假設嗎？在 1998 年的時候，大概有 1000 個限制條件，到了将近 20 年之後的現在，即使有 100 萬個限制條件，計算機系統也能夠解決這個問題。計算機科學裡面，有各種各樣的東西是需要獲得進展的，現在沒有具體的算法能夠随着各種各樣的限制條件增多的情況下同時獲得進展。但是，我們在這裡能夠看到一個線性的進展，為什麼會成功？這裡有一些紅色的線表示，它是不斷通過發展算法來獲得進展的。

在遊戲方面，比如撲克方面的推理，計算機在撲克牌遊戲裡面要戰勝人是非常非常難的。但是，在一些簡單的撲克牌遊戲裡面，計算機做的比較好。在 2003 年，計算機隻能夠處理非常少的資訊，比如撲克牌桌上有多少張牌這樣的，後來又獲得了一些進展，2014 年加拿大的 michael bowling 集團說，他們可以處理 13 個資訊集，這在 11 年的時間裡面，算是取得了極大的進步。

現在在人工智能方面也有一些經典的問題，比如圍棋、比如 deep blue 項目。deep blue 當時是人盡皆知的。但很多年以來，計算機下圍棋一直表現得不是特别好，人們有些灰心喪氣，2008 年的時候，很多人當時是能夠戰勝計算機的。但是，随着時間的不斷推移，出現了 monte carlo 樹形研究，不像國際象棋，圍棋需要有機率論，monte carlo 的樹形研究對未來有一個研究和推理，表現在 alphago 擊敗李世石上就是比較好的。

另外，monte carlo 樹形研究在其他領域也有很多的造詣，比如在圍棋方面有一些視覺上的研究，不光是對于未來的推理，我們也需要了解這樣的圍棋圖形。

在個人助理方面，我們也取得了一些進步，比如 siri 還有 google 助理等等，可以回答一些簡單的問題。例如我要去我哥哥家裡，我想帶一些便宜的酒，計算機要做什麼，它怎麼回答我的問題？我需要紅酒。我在網際網路上找一些菜單吧，什麼樣的紅酒和蕃茄醬配合非常好，或者什麼樣的酒和什麼樣的菜能夠配好？還會問，我哥哥住在哪兒，從我現在的地點到他家裡面有怎麼走是最合理的路徑？這條路徑上有什麼最好的商店？有什麼樣的價格、什麼樣的酒？個人助理就能這樣給你一個計劃，帶着你左轉右轉買一瓶酒，價格是 10 美金，買了之後可以繼續駕車去哥哥家。

這是下一代的個人助理系統，對于各種各樣知識的整合，關于菜單的搭配，關于酒的知識，關于我的聯系人以及駕車的方式還有駕車的路徑等等各個方面的整合。這也是下一代個人助理最大的挑戰之一，因為它涉及到整合各種各樣的資訊，我們需要考慮一下，我們需要用覆寫整個行業的眼光和思維方式來考慮，也許我的助理它需要來做一些什麼，才能了解周圍的什麼情況。

另外一個領域也獲得了很多進步，就是資訊提取。現在在google上搜尋，你會看到很多資訊框，有時候隻是來自維基百科上的拷貝，但是你搜尋 thomas edison，上面有維基的資訊，還有更多的資訊，包括他最近的收入、利潤以及相關的股價，這個是通過來讀取網站上現有的檔案和資訊來抓取的資訊。

關于在資訊抓取上是否合理、合法，其實有過一些讨論。有來自世界頂尖大學的教授，他們也提出過，你如果想看各種各樣檔案的話，有一些檔案來源于公司放到網際網路上，那到底是不是需要來獲得這些公司的支援和認可？我們也需要來了解相關的情況。因為我們在執行合同的過程當中，我們要看一些有效的法律合同，如果隻是自然語言合同的話，我們怎麼樣能夠把它變成正式的語言，那麼有這樣一個共識。

最後講一點，個人行程安排助理，有很多公司，x.ai、kono.ai。首先要看看最關鍵的東西，要看你的郵件來建議會議的時間并且做好協調工作，這對我們很多人來說都是一個痛點，我們得找到所有人有時間的時候開會。

以上就是我關于 ai 應用的一些觀點。

ai 技術：機器學習、推理、大量訓練資料

接下來我想要談一談非常重要的技術，我覺得我們目前非常重視技術，我們談到深度學習、長短時記憶，還有結構的預測。像自然語言的處理、翻譯，還有資訊提取，所有這些都是結構的産出。我們看到這個圖像，它有很多的點，必須要有一個結構，搞清楚這些點之間的關系。機器學習還有推理的過程，另外還有 smt 的解讀器，能夠解決很多的問題。

還有一個非常活躍的就是自動算法的配置，我們知道通常情況下像商業的計劃，計算能解決很多的問題，但是必須要配置。70% 是控制調解器的，機器學習方面必須要看到問題是怎麼解決的，還有自動化的計算配置，我們必須要判斷，有什麼樣的算法是最合适的。

另外一個，大資料，要有大量的資料，像很多的影像和視訊的資料，我們要識别事件、活動，還有一些物體，所有這些視訊當中的物體。在自然語言方面對很多的語言處理像有一個樹形的資料庫，對于語言翻譯，我們必須要有很多的文本，兩種語言之間的文本，我們必須要實行兩種語言之間的轉換。在沒有這樣一種訓練資料，就不能實作我們的目的。像超級計算機，還有晶片都在不斷被開發，幫助實作我們的目的。這就是我演講的第一個部分。

ai 四大挑戰：信任、互動界面、常識、安全部署

好了，我們未來所面臨的一些挑戰，我談四個挑戰。首先，信任，什麼時候能夠信任 ai 系統？我們總體上想一下，怎麼樣能夠確定軟體系統還有機器系統是值得信任的。第二，人機互動的界面。我們要仔細地談談這部分。第三，常識。這已經是在會議上頻繁提到了，最後，還有 ai 在安全應用方面一些部署和應用。

1. 什麼時候能夠信任 ai 系統？

首先，我們談一下信任的問題，大部分的ai軟體都是用機器學習，但是機器學習是一個統計學的資料的過程，它并沒有很大的正确性的保證，是以我們不能夠證明這個機器學習的準确度。李飛飛實驗室有一個很有力的例子，（圖示）小男孩拿着棒球棒，而不是一個牙刷，這就是一個錯誤，這是一個非常大的錯誤。信任 ai 系統有什麼樣的挑戰？首先我們要看到它的優劣勢，首先它是能夠産生一定的置信度的，我們必須要看到這個答案，它的正确率的情況，這就要讓我們的系統必須避免一些點，一些不确定的點，就能夠讓我們用一個更大的系統來采取更好的方式。

第二，ai系統必須要解釋推理的過程，有一些系統深度學習的系統已經運轉得非常好了，但是，對于終端使用者，我們必須要了解系統預測的時候重視的是什麼，我們必須進行解釋，這個系統到底主要處理的是什麼，像在視訊方面，到底想了解的事件是什麼，目前在美國人工智能的競賽，包括我的團隊也參加了這個競賽。

第三，讓 ai 系統變強，強化這個系統。這樣能夠避免一些錯誤的設計，有些時候這些錯誤是我們意識不到的，比如說系統到底會進行一些什麼樣的部署，我們有的時候并沒有意識到我們意識上的空白，我們要不斷地發展 ai 系統，我們要增強人工智能系統，最終我們必須要證明一些方法論。由于軟體系統不能證明軟體的正确性，我們要進行一些實驗一些測試，但測試并不能解決有效性正确性的問題，因為 ai 的軟體非常複雜的。機器學習是一個挑戰，因為訓練情況的不同，可能測試的結果也會有不同。

2. 人機互動界面：human-in-the-loop

接下來的挑戰就是使用者界面的問題，雖然好萊塢的那些電影有各種各樣的結局，我覺得人工智能不會牽扯到一些全部自動化的體系。例如你開車，要接受訓示，現在仍然人在開車，是以你是在執行這個行動。像自動機器人，就是在回路上，你也是在監控計算機的行動。

另外一點我們很關注的，人機協作，這是人和生物硬體之間的合作。你可能會聽說過“半人半馬的象棋活動”，半人馬系統能夠打敗人類，也能夠打敗象棋的機器系統，它其實是補充了人類對于象棋知識的不足。

這是非常有意思的一個項目，蛋白質折疊遊戲。我們可以通過這個遊戲發現蛋白質，我們現在從生物上了解這個蛋白質就是了解它的結構。有不同的神經系統體系，這是蛋白質能量優化的算法，但是這是一個非常困難的搜尋遊戲。華盛頓大學開發了一款遊戲，讓人們能夠提供一個指導，并且能夠指導遊戲的局限性，能夠讓這個優化器能夠更好地工作。這種人機協作比單獨的人或者單獨機器工作要更好，2011 年的時候，用這樣一個技術，在三周就解決了艾滋病病毒酶問題。這對于我們未來是非常重要的，我們會跟計算機更好地合作，這樣能夠擁有超能量，這是現在所沒有的。

3. 有關常識的挑戰

接下來談談第三大挑戰，常識。

如果要跟計算機合作的話，要跟機器人合作的話，我們必須要有非常好的使用者界面和它們進行合作。有一個問題，計算機必須要了解人類的意圖，通常傳統的界面，人給計算機下指令，計算機接受這種指令，指令和接受的過程。

但是，現在要讓計算機了解人的意圖，像米老鼠它說“給我拿水來”，拖把就把水“拿過來”，但是最後米老鼠快被淹死了，這就是一個很有意思的故事——人工智能沒有很好地了解說話者或者說人的意圖。

那麼，計算機怎麼能了解人的意圖？這就是常識的問題。什麼是這方面的常識？有的人不知道，是不是所有人都同意這一點，很難。

但是，我認為我們需要讓計算機了解所有的人類都了解的、無論是寬泛的還是淺顯的知識，無論是人類的行為，還是一些具體的物體。

我們必須讓計算機了解普遍的知識。cycorp 開展的研究，已經 30 多年了——我當教授也30 多年了，能夠讓計算機了解百科全書的每一篇文章，是人工創造知識的基礎。結果有點令人失望。我們有沒有其他的選擇？是不是要用機器學習來獲得常識？因為“常識”的覆寫面很廣，需要我們付出巨大的努力，哪怕我們已經在 ai 方面取得很多的進展，像智能電話、還有物聯網。

另外，這些資料可能會有一定的副作用，在我演講的時候，我必須要去搜尋引擎來找到資訊，找到演講的主要内容。如果我們有一個常識訓練的資料，我們就能夠很好地部署機器，通過物聯網就能夠有更多的訓示，能夠讓計算機了解更多人類的常識。

最後一個問題，實際上也很重要，那就是誰能夠為此出資。

4. 如何安全地部署 ai 自動化系統？

最後一個挑戰，是我們都非常重視的安全的應用，最近 ai 的一些進展都鼓勵我們要在一些高危應用方面來部署 ai，我們都談到無人駕駛汽車，這是一個非常重要的 ai 系統。

還有自動外科手術的系統，主要是自動外科手術 ai，這個機器怎麼樣能夠自動進行一些外科手術和其他一些協助？

現在已經有了 ai 的對沖基金，像在上海和一些其他的地方都有 ai 的對沖基金。

另外，人工智能的電網能夠很好地持續供電，在包括風能、太陽能、核能方面都能夠得到更好的應用。

那麼，我們現在的挑戰是什麼？

我們知道，機器學習還有軟體工程都可能會有失敗的模式，是以我們現在很難解決安全的問題，需要來執行很多的系統來應對這個挑戰。

還有使用者界面失敗的例子，我們已經談到了這方面的例子，比如說如果是飛行員或者司機沒有給到正确的訓示就會發生不好的事情。

接下來談一談自動體系的兩個風險，一個是網絡攻擊，另一個是人類對于系統的監督和監管。當然，以 ai 驅動的軟體畢竟也是軟體，是以當然它跟其他的軟體一樣，都是有弱點的，像是網絡襲擊，也是會攻擊到這個體系——當然，對于 ai 系統，可能需要有一些新的攻擊方式。

如果訓練用的資料集遭到污染，可能會影響到認知系統，罪犯可以用這樣的技術，影響推薦系統、廣告系統，也能夠影響股票的價格。同時，有很多 ai 系統人類是不能夠很好監管的，它可能會運轉的速度很高，人還沒有反應過來，就可能沒有監管到機器的運作。幾周之前在英國發生了一起事故，在華爾街那裡也發生過類似的事件。

還有一個例子就是系統的控制程序非常慢，比如說人類從地球到火星上面的溝通過程不可能特别得快，還有在空間得不到無線射頻，當然還有對人類的注意力，可以慢慢減少。我們看99%的情況下，自動駕駛都是沒有任何的問題，但是人類仍然需要來進行監控，如果說人在自動駕駛的車上來做其他事情，或者說分心，也可能會出事。

系統不是百分之百完美無缺的，我們也需要讓人類來承擔一定的責任。人不可能坐視不管，或者完全分心。在自動系統中也是如此，我認為我們應該是非常小心謹慎地向前邁進，尤其是在一些高風險應用的時候。

在你的手機上去載一個軟體，比如下載下傳一個語音識别app，這種下載下傳和自動駕駛是不一樣的概念。如果在用在武器上出了問題，那在武器上出的問題和下載下傳的時候下載下傳不下來出問題又是完全不同的兩個概念。但不管怎麼說，我們在錯誤的改進方面還是取得了很多進步。

我相信在座的各位有些是剛剛開辦公司的，你們是創業者，在今後 ai 方面會有很多的機會。我們面對的挑戰就是，應該什麼時候來信任這些系統，有一些系統是無縫的。如何創造出一套不會出錯，或者錯誤率非常低的計算機系統？我們如何創造一套不需要人類監控就能夠自己完成任務的 ai 系統呢？

機器學習創始者、AAAI 前主席Thomas Dietterich：AI發展四大挑戰 (35PPT)

繼續閱讀

開源低帶寬語音編解碼器

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希