天天看點

UC伯克利教授邁克爾·喬丹采訪:人類對機器學習期待過高,機器學習的發展還應當更廣闊

[] https://www.leiphone.com/news/201706/PgZMWek7tdYpBXf5.html

雷鋒網 AI 科技評論按:2017年6月21日至22日,騰訊·雲+未來峰會在深圳舉行。在昨天主題為“機器學習:創新視角,直面挑戰”的演講 - 雷鋒網後,雷鋒網 AI 科技評論在内的多家媒體共同對演講者人工智能泰鬥邁克爾·歐文·喬丹(Michael I.Jordan)進行了采訪。

與演講中一樣,這位UC伯克利計算機系教授,美國科學院、工程院、美國藝術與科學院三院院士認為人工智能/機器學習能幫助解決不少人類的問題,但是前路還有很多問題等待人類來解決。另一方面,對于現在火熱的神經網絡/深度學習,邁克爾·喬丹教授認為機器學習的範疇很大,神經網絡隻是其中的一類方法;未來的人工智能如果要更可靠、更強大,單獨隻靠神經網絡是遠遠不夠的。

以下為采訪現場實錄,雷鋒網 AI 科技評論聽譯。

UC伯克利教授邁克爾·喬丹采訪:人類對機器學習期待過高,機器學習的發展還應當更廣闊

記者提問:深度學習現在已經愈發火熱,有人認為深度學習已經在某些應用中取代了傳統的機器學習算法。在您看來,在深度學習未來的訓練、算法優化中,有哪些亟待解決的問題?

邁克爾·喬丹:深度學習隻是一種方法,它沒法解決所有的問題。還有許多别的機器學習算法,比如叢集算法、因果推理算法、多重選擇算法等等,機器學習範疇裡有很多的方法可以用。當你有大量的帶标簽資料、想要得到一個輸出映射的時候,深度學習就很适合。但機器學習可以解決的問題有很多,并不局限于這一種。而且深度學習的解釋性很差,很難跟人解釋它在做什麼。它效果非常好的領域主要是模式識别,比如給計算機音頻視訊加上标簽,這個标簽就是我們要的結果。類似這樣的問題有很多,不一樣的問題也有很多。是以我覺得機器學習是那個更大的範圍,那麼深度學習,架構上看它有很多層,但是還有很多别的架構也有許多層的,比如決策樹、圖模型,用在其它的方面。是以我覺得未來我們還是會探索更大的空間,而不是僅僅關注一兩種方法。

記者提問:人工智能的最新發展也從仿生學受到啟發,我們可以從人類和動物身上學到更好的解決方案。從您的研究看來,我們還能做更好嗎?

邁克爾·喬丹:我覺得我們的研究不是受仿生學啟發的,不是的。我覺得梯度下降,或者叫做反向傳播,是讓這些大型系統具有優秀表現的最重要的算法。那麼梯度下降、反向傳播就跟大腦的工作方式很不一樣,它不是來自于大腦的啟發,而是來自于數學。是以我們要小心來自神經科學方面的限制,神經科學中研究的是具有複雜空間分布的神經細胞,它們可以有穿透或者非線性的行為,它們之間的連接配接方式無比複雜。我們對神經還沒有研究清楚呢,是以在我看來(說深度學習網絡像動物神經細胞間的連接配接)隻是一種比喻,除此之外的說法都有問題。如果真的是那樣的話,我們其實應該模仿動物的神經細胞才對,雖然也有人那樣做,但是沒有取得什麼進展。是以我們走到今天這一步靠的是數學、計算機等方面的原理,而不是靠仿生學。

記者提問:深度學習仍然是機器學習的主流工具,不過也有人覺得不應該過早孤注一擲。相比需要大量資料的深度學習,也有像機率程式設計這樣典型的使用少量資料的例子。那麼您怎麼看人工智能研究目前的同質化現象,您對不斷出現的新方法是如何看待的?

邁克爾·喬丹:如果我們看看現代機器學習庫的話,比如基于Spark的機器學習庫,裡面有各種各樣的方法,它們都有各自的作用,比如用矩陣譜、叢集算法以一定方法建立推薦系統,比鄰的方法也可以用來解決一些問題,增強學習也經常可以轉換成一個大規模的樹搜尋。是以确實,用到神經網絡和反向傳播的稠密矩陣操作是非常有用的,比如NVIDIA就有各種需要的軟硬體可以支援各種不同的方法,它确實能支援深度學習,但是如果我要解決的問題範疇裡标簽的數量很少,比如文本,我隻是想要識别一段不帶标簽的文本的特征,我可能用語言學配置設定方法就夠了,這就是一種人們在這個範疇中用來找到文字重點的方法。說這麼多你應該懂了,深度學習不是唯一可行的方法。雖然給它制造專用的GPU、TPU确實重要,可以支援很多種不同的應用。但是我們想要建立下一代的架構,它要能支援樹操作、搜尋操作、限制下降操作和其它一些需要的語言學操作,而不僅僅是一層層的矩陣。

記者提問:您如何看待中國的AI潮流?您認為騰訊能在其中扮演怎樣的角色?

邁克爾·喬丹:我對騰訊的情況不太清楚,不太好評價,我隻知道外界看來他們除了社交網絡外還有很大一塊娛樂和遊戲業務。在現在這個階段,有遊戲和娛樂的環境,就可以模拟出一個虛拟世界,在裡面得到準确的事實,進而生成真實世界可能無法得到的标簽;而且可以在強化學習方面起到幫助,在虛拟世界裡面可以做海量的搜尋;或者還有其它方法,都可以大規模地使用我們現有的機器學習技術。還可以在虛拟世界中嘗試一些真實世界中可能會傷害到人類的技術。利用内在的遊戲技術可以探索機器學習方面的新想法,這很重要,騰訊看起來似乎也有很大的自然優勢。

記者提問:大資料催生了很多工業應用,許多網際網路、金融證券巨頭都開始涉足AI。您看好AI的前景嗎?

邁克爾·喬丹:人們對AI的期待太高了。語言方面的期待是最高的,許多人都覺得聊天機器人會發展得像人差不多,不過我不太相信,我覺得聊天機器人對世界的了解是沒辦法跟人類相提并論的,比如了解上下文、了解語言的發展——以前是如何表達的、如何了解可能發生的事情——人類有對事情的預見,針對不同的環境可以建立不同的計劃、運用舉例類比比喻。我小孩今年5歲就可以做到所有這些事情,但是人工智能很長一段時間都做不到這些。人們期待人工智能的智力水準可以達到小孩的程度,但是小孩能做的事情也很多啊,是以這是做不到的。這方面的期待太高了。另外人們還期待AI系統可以在某些方面比人類更聰明,但是我們永遠都不會讓機器人成為決策者,比如做CEO、CTO之類的,它們沒有對世界的那種微妙的了解,沒辦法抽象地做推理,沒法面對不确定性的事情還做出優秀的決定,沒有好的直覺。是以我覺得人們期待人工智能做這些,不是那麼理性。

記者提問:我們期待人工智能除了做計算性的思考,還可以做推理和決策。您認為大資料在這些方面能發揮作用嗎?

邁克爾·喬丹:大資料是必須的,但是隻有大資料還不夠。借助大資料,很多以前做不對的細節現在可以做對了,但是這不代表你就能清楚地觀察全局、能了解抽象的概念、能做長期的推理、能改變事情發生的可能性、對事情做出預見。是以,其實推理是很難的,在多步驟的、具有不确定性的狀況下,人類能做得非常好,但是人工智能系統就需要用大量的資料反複訓練,然後才能在某些步驟中模仿人類,但這還是沒辦法達到人類的水準。

記者提問:那有沒有新的算法可以達到更好的效果呢?

邁克爾·喬丹:沒有,據我所知還沒有什麼那樣的神奇算法。肯定還需要幾十年的研究,要有更好的算法、更好的工程技術做出的更好的模拟器、用正确的方式收集資料、建立起大型的合作機構比如企業,付出努力解決關鍵的問題。在這個過程中會有越來越好的算法出現,有可能會有突破性的算法出現,不過我也不确定會不會出現,我覺得都不是很必要。會有突破的是,新的組織資料、組織決策、組織以往資訊的方式,然後與人類協作,讓人類成為其中一環,讓機器學習變得更好,達成人類的目标。你得明白,計算機視覺、語音識别這樣的技術就是在最近的30年裡慢慢變得越來越好的。我們感覺到明顯變好了,但這都是基于以往的經驗一步步過來的。未來很多方面的發展也會是這樣。

記者提問:MIT科技評論有篇文章中提到過“AI内心的黑暗秘密”,他們的意思是,沒有人知道最先進的算法工作的時候具體是怎麼工作的。美國國防部甚至認為可解釋性是AI發展的一大擋路石。您是怎麼看的?

邁克爾·喬丹:解釋性是衆多問題之一。還有魯棒性、安全性、語義性、抽象性等等許多問題,解釋性隻是其中一個。如果某個領域内對神經網絡最大的擔憂是它的解釋性的話,那也許就這時候就不應該用神經網絡,而應該用決策樹,解釋性要強得多。決策樹是沿着路徑往下走的,人類可以了解路徑上的每一步,而且可以根據不同狀況做出不同決定,用事情發生的前後關系做判斷。不過它的性能就不如神經網絡那麼好了,但是也不錯。還有一些領域如果有足夠的資料也可以用随機森林-多選擇決策樹,它的效果和神經網絡差不多,而且也可以用在對解釋性要求更好的場合裡。對做決策來說,人類決策的解釋性比決策樹還要好得多,人類可以預見到應該考慮什麼、沒有考慮什麼,還能解釋出為什麼有東西不需要考慮。我們現有的學習模型都不擅長這些。是以這個确實是一個大問題,不會有一個全新的方法可以橫空出世來給神經網絡解決這個問題,很難沿着某個路徑進行解釋,我們隻能在神經網絡的外圍設計别的東西。另外,我覺得總體的來說,單獨一個神經網絡對大多數問題都不是合适的解決方案,它應該隻是一部分,和其它的部分共同協作起來、考慮其它的情境、在周圍建構一些其它的架構,才是好的解決方案。

記者提問:您在演講中提到,我們需要建立一個在正常工作的同時還要能不給人添麻煩、不引發災難的系統,這樣的系統現在有沒有呢?

邁克爾·喬丹:這需要深厚的工程能力。比如資料庫,人們還沒有用機器學習的方法去做資料庫,但是銀行系統就能很好地工作,全世界的資料庫之間不停地進行聯絡和交易,不僅做到了即時性、還做到了協作性。當我自己全世界旅行的時候,我銀行賬戶裡的錢不會跟着我來回交易,但是我和我妻子兩個人用同一個賬戶,一個人在美國取錢,一個人在中國取錢,賬戶餘額還是對的。這樣的系統服務着幾十億人,這是驚人的成就,僅僅靠來回發送資料。“這些資料是哪來的”、“在發生了這樣一系列事情以後應該如何應對”,資料庫系統做的就是這些事,它沒有什麼學習功能,但是它也需要有智能的基礎設施才能讓人感到信任、才能保證正确等等。如果把這樣的思路和機器學習結合在一起,那就能對什麼事情是能發生的、未來會發生什麼做出預測。是以,這應該不算是什麼突破,但是需要深入的工程研究才能設計出有多種防範能力的系統,然後就有了能判斷出相關的資訊、能正确選取資訊用來做預測的系統。這其中牽扯到很多選擇,如果知道在同樣的環境中采集到的資料有哪些是可用的,資料庫已經為你分析好了,那你就會更信任這樣的資料庫系統。這就是做預測困難的地方,你在環境中采集到的資料可能和資料庫中的不一樣,你沒辦法采集到所有的資料。在真實世界中,你需要知道哪些資料是有關系的,還要知道為什麼,然後才能用它們做出預測。是以能做好這個的系統需要多種組成部分,需要有工程化的思考。

繼續閱讀