天天看點

[譯]深度學習:模仿人腦還是完善應用

近期,機器學習領域專家們關于深度學習的一些言論引起了極大的轟動。同時,關于深度學習的開創性和整體架構也在學術界引發了相當的讨論。伴随着人工智能開始進入進一步開發應用階段,人們意識到它的成功與否完全取決于其實用性。

星期二,我和ibm沃森研究中心的副總裁john gordon先生有過一次半個小時的專訪。在專訪中,gordon先生從始至終都不認可人們對人工智能系統“沃森”的預期和它實際能做什麼之間存在相當的差距。雖然在我和gordon先生之間存在必然的誤解,但很明确的一點是:gordon先生相當看重下面一點的積極作用——學習和使用“沃森”系統的軟體和雲接口是一件相當容易和愉快的事。它對開發和完善新的應用有着巨大的幫助。

gordon先生的觀點最初讓我很不解,但是,當我深入思考之後,我開始接受他的觀點。正如gordon先生所述,在不久之前,“沃森”系統還隻是給少數ibm内部博士級科研工作者們的工具,但現在,任何人都可以用它來測試自己的應用軟體和資料。人們并不需要斤斤計較這個系統能否提供人工智能,人們願意使用雲服務的關鍵在于這個系統到底能不能幫人們實作他們需要的工作。

[譯]深度學習:模仿人腦還是完善應用

第一批“沃森”系統上的應用程式開發接口。thefirst set of watson cloud apis on ibm bluemix.

這一情形正發生在目前人工智能最火的領域——深度學習。深度學習是一個有着深遠意義的領域,而不僅僅是一些誇張的說法。ieee spectrum(雜志——電氣電子工程協會綜覽)最近采訪了機器學習領域的專家——加州伯克利大學的教授michael jordan先生。在這次訪談中,jordan先生專門針對這個領域的一些誤解予以了澄清。

jordan先生的言論可歸結為如下:深度學習并不是那麼具有革命性的新技術。它隻是對某些應用能提供幫助,而不是來模仿人腦工作。那隻是一種不太準确的比喻。(後來jordan先生在另一天對大資料也闡述了他的看法,其後還在部落格上對一些對他觀點的誤讀作了進一步澄清。在更早的九月份,jordan先生在reddit網站的一個欄目“ask meanythin”也發表了他對深度學習的看法。)

jordan先生可能在很大程度上是正确的,對我們大多數非科研工作者來說,明白這些模型具體怎麼工作或是了解是否這些研究人員在誇大其結果的意義都沒有什麼實質的作用。yannlecun先生(一名紐約大學的研究人員,facebook人工智能項目的經理)在facebook上針對jordan先生的言論評述道:

“深度學習本身和那些被證明有效的模型并沒有任何問題。雖然那些模型背後的理念在80年代就已經被提出。這并不意味着在這些理念基礎上建立的模型就沒用了。”

近來,深度學習由于其在模式識别方面的巨大作用激起了人們的廣泛興趣。隻要它還在語音識别,圖像搜尋,文本短信和使用者推薦等方面進一步發揮作用,人們的熱情就将繼續下去。從某種程度上來說,它的意義在于它的實用性,就像我以前說過的“深度學習更像複合木地闆一樣,因其簡單實用,而得到廣泛認可。從這個角度來看,它并不像人類大腦裡的神經元。”

[譯]深度學習:模仿人腦還是完善應用

200多名聽衆聆聽了百度首席科學家andrew ng 在“人工智能的未來”上關于深度學習的講座。biz carson/gigaom

about200 people showed up at our future of ai event to watch andrew ng of baidu, andothers, talk about deep learning. credit: biz carson / gigaom

深度學習更讓人感興趣的在于它的各種模型在如此短的時間裡從科研試驗室進入到普通人手中,并被開發成各種各樣的新的應用程式。現在已經湧現出基于深度學習的各種開源工具(包括word2vec,deeplearning4j, h20和caffe),商業軟體(來自于各大公司如graphlab,nvidia,ersatz labs和微軟)和大量為應用開發者準備的針對特定任務的應用程式接口(來自于如alchemyapi和clarifai一類的公司)。

同時,gordon先生進一步表示語音識别和計算機視覺也會逐漸進入“沃森”系統的開發範圍。

由于大量開源應用的出現,深度學習在上述應用(語音識别,計算機視覺,甚至可穿戴技術和機器人)中得到了更為廣泛的應用。商業界和學術界都同時在深度學習的基礎上對這些領域開展了更廣泛的研究。而在以前,商業界和學術界通常是專注于不同的方面的。

深度學習并不是能解決一切問題的革命性人工智能技術。若真是如此,人們何必還要繼續在量子計算機和人腦系統上花費時間和精力呢。為此,oren etzioni(阿倫研究院人工智能項目ceo)(編者注:阿倫研究院是由——微軟創始人保羅-阿倫捐助的專注于人腦領域的研究機構)在9月gigaom’s的“人工智能的未來”研讨會上,就利用深度學習完善分類算法和那些能回答更深程次問題的智能算法之間的差別作了一個專題講座。

所有的技術,當它們從試驗室出來進入到開發應用階段後,它們唯一的評判标準就是有用與否,“沃森”系統和深度學習也不例外。

orenetzioni (allen institute for ai) on building intelligent machine

https://www.youtube.com/watch?v=e_6az8slivc

[譯]深度學習:模仿人腦還是完善應用
[譯]深度學習:模仿人腦還是完善應用
[譯]深度學習:模仿人腦還是完善應用
[譯]深度學習:模仿人腦還是完善應用

“深度學習通過對大資料的分析來實作對研究對象的分類和預測,進而完成對問題的“是”或“不是”的回答。但是,大量的問題是不能簡化為“是”或“不是”。同時,大量問題也不能簡化為簡單的若幹個變量分析(比如電影推薦,自主發tweet)。很多問題需要建立更為複雜的能‘自我構造’的理論——這個理論應該是多層次的,能自主題曲學習知識,然後萃取出新的理論,做出合理推論導出新的結論。這一類問題包括“算術學習,國際象棋,了解語言”。尤其在了解語言方面,機器需要了解相當大量的相關知識才可能真正懂得語言所要表達的意思。目前相關知識的機器學習方面還很缺乏。同時,人工智能在自我提取,學習相關知識方面也還很欠缺。綜上所述,目前的深度學習主要完成的是對大資料的分類和預測。要進一步發展基于大資料的人工智能,需要更為複雜的模型。這些模型要能完成從大資料中提取相關知識,學習了解相關知識,萃取出新的理論,做出合理推論,進一步完成對新問題的回答。”

很多專業人士花費了大量時間來定義雲計算或大資料,更多的非專業人士(非分布式系統專家)卻在忙着開發各種基于上述的應用。這些人并不是這方面的資深人士,他們隻是由于熱情和興趣并在合适的時候進入了些個領域。這些人開發出來的應用可能有各種各樣的問題,但很多時候并不妨礙它給人們以幫助。很多系統(如amazonwebservices和hadoop)在才出現時都有很多缺陷,但他們都得到了廣大使用者的支援,僅僅因為他們能幫助人們做一些事情。有些技術(如docker和kafka)現在已經從主流技術新聞上消失,但他們還是在不斷吸引新的使用者。

目前,普通使用者們起着關鍵作用,使用者來通過他們的實際使用來決定誰是赢家。深度學習不是一個高深莫扯的“天網系統”或全新的“神經科學”領域,是以,雖然學術界還是在決定科研的方向,但對廣大開發者和使用者來說這已經不重要了。

歸根結底,一項技術如果有用,人們會努力去完善它,如果它沒用,或者有更好的技術出現,這項技術就必然會萎縮直至消亡。将來,深度學習可能也會被人們遺忘,但肯定不是它沒有得到應有的炒作,而是因為它在那個時候已經不能滿足人們的需要。

原文釋出時間為:2014-11-12

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀