導讀:人工智能一直為人們所關注,alpha go戰勝李世石等事件,将人們對人工智能的認識和讨論推入了新的階段。
6月6日,清華大學計算機系校友、搜狗公司ceo王小川于清華人工智能論壇上做了題為《alphago的幕後與思考》的演講,論述了在alphago人機大戰背後的故事,這場大戰有着怎樣的意義,以及人工智能研究和産業的碰撞。
演講全文如下:
今天我更多想給大家分享我背後看到的關于有趣人性的東西。之前的嘉賓們講了很多學術,學術跟企業的碰撞,最後講一個交接點,一個大的趨勢以外,還有一個人在裡面扮演什麼樣的角色,找到自己的定位。是以我今天選了這麼一個題目。這個題目中間第一件事情就是4:1的比分,每個人都已經看到了,而我對它的了解,先用一個詞,它是一個學術與市場營銷的完美的結合,特别是在東方,全中國人我估計95%都知道這樣一場比賽,而且徹底颠覆了我們對技術、對人工智能的了解。
但是為什麼這麼說呢?我先用一個詞,google背後的心機。google在今年1月份在《自然》雜志上發表了這個事,是跟樊麾打一場比賽,比賽前跟樊麾簽了一個協定,我跟你比賽結果不管是輸是赢,你不能對外透露任何細節,就是不能跟外面講,是保密的,這是他幹的一件事情,為什麼他這麼幹呢?很有意思,論文發出來的時候,如果假設提前告訴了公衆說先不發論文,我先跟樊麾比了一場,真正有多大學術的高度?可能沒感覺,看到樊麾比賽的人會知道有學術意義,如果光看論文,大多數是沒有感覺的,但是跟大衆講說我們智能赢了這個人,是以google這個團隊心思之缜密,不僅是在做研究的這群人,一下子把這個事情推到特别大的高度。
另外他們為什麼選樊麾?事後諸葛再看這個事情,如果他選一個職業選手,但是是一個沒有世界冠軍的頭銜的,我們覺得挺low,跟以前一樣,以前好多程式都是偏業餘的,感覺不好。一來給大衆一個感覺,找了一個世界冠軍,一個歐洲冠軍,挺高的頭銜,但是對專業選手而言,僅有二段,不算高手。我覺得既把眼球吸引到了,但是反過來又留下了給大家的想象和争論的空間。是以之前在1月份看到很多很多的文章在講這個程式,其實離圍棋還是很遠的,這是之前的了解。
比賽之前大家是什麼心态呢?比如聶衛平講,說是覺得計算機一點機會都沒有,不可克服的問題,認為機器能夠下棋是沒有判斷力的表現,講得很憤怒,甚至還有中國隊的圍棋總教練俞斌,他是在圍棋界裡面計算機學得最好的,在80年代就自己寫下圍棋的計算機程式,得到很多認可。
我認為機器是一點機會沒有的,因為我認為計算機有它不可克服的問題,人和電腦相比,100%是人赢。我想在這裡面能夠看到人性當中脆弱的一面,每個人都有,每個人生病的時候都有自己的壓迫,别人說你特蠢,微軟這個東西做得特爛,大家都不開心,每個人都有自己的自尊心在裡面,這件事一定會把一部分人放在我們自己的曆史舞台的對立面裡面去,圍棋選手今天很不幸,在下棋上有這樣的問題。
計算機的問題怎麼講?比如李開複講認為alphago比較懸,但是未來能赢,it界的人不會說機器幹不過人,他自己的存在感就沒有了。但是通常都認為機器沒有這麼快,以後會赢得。這次這樣一個比賽,大多數搞技術的人都沒有感覺到這個事情發生有這樣的速度。我很有幸,在2月份的樣子,我在知乎上發文章,說這次alphago會完勝,滿足了張钹院士講的三個條件,第一,我提出了問題,我看到了下棋,人工智能在下棋上是一個重大的事,好多人覺得沒有這個問題存在,沒有想這個方向。第二個我看到它會赢,第三個,我知根知底知道為什麼會赢,我認真地讀了論文,找了下圍棋的人請教,我鬥膽發了這樣一篇文章,是有勇氣的,最後也被驗證成功了,理想跟現實之間差别是很大的,對于這樣一個技術趨勢裡面,我覺得我是有判斷,但是市場股價沒辦法思考。
比賽前到比賽後就是七八天時間,給alphago取了一個新的名字,叫“阿老師”,我們特别希望中國有人做出這樣的阿老師來,把它當老師看。之前不是,之前覺得一無是處。我還很尊重他,他願意脫帽子給機器緻敬。網友叫它“狗狗”,給了很好聽的名字。這裡面反映的什麼事?
在比賽前、比賽後,我們對機器的了解裡面産生了巨大的變化,我們開始接受它,開始把它拟人化,而且比分很巧妙,4:1,如果赢五局可能就不好了,不是圍棋選手被滅了,是人類被滅的感覺。帶來人和人平等的關系開始建立,印刷術建立之後,我們開始探讨人和人之間的關系。後來我查史料,文藝複興這樣一個運動,它其實是從封建社會到資本主義社會之間的一個分水嶺。咱們中國現在還沒經曆這個運動,是以有一點點問題。但是alphago之後,我覺得今天帶來我們重新的思考,就是機器和人的關系,去思考這個事情,有專家會講機器還不行,但是有人講機器以後會颠覆人類,我們開始思考這個問題,以前認為機器就是機器,拔電源就行了。診斷報告是機器給做的,說你這個人有什麼問題,看片子看得怎麼樣,找專家、找人。但是在今天照片子之後,機器給你診斷效果可能是比人更準的。我有一個朋友,也是清華的一個同學,他就是做ct看片子的,做乳腺看片子,他說大多數醫生看片子準确率是40%,他現在到70%,已經高很多了。我們今天接受機器在裡面能做很多的判斷。這是我們巨大的一個心理上的變化,我把它稱為“第二次人類自己的運動”。
對于機器智能,大家講了很多了,有各種專業的方法,包括怎麼定義人工智能,我們做産品的時候,就是想機器怎麼能在裡面做決策、做識别,目的還是希望能夠做決策。從做決策這件事情裡面就分了三個層次。
第一層,将傳統方法交給機器。第二層,将答案交給機器記憶學習。第三層,将目标給機器自我學習。
這是我自己的了解,也是跟alphago脈絡一緻的,其實最早的專家系統就是第一個,我們把規則交給機器,我們不管提符号主義,我們就把是把計算機世界變成一個邏輯,告訴機器,這是原來的階段。但是這個階段裡面重大的問題,如果我們自己會做,但是我們沒法去教機器,我們不知道怎麼描述的時候,這個機器就不靈了,而且教出來的徒弟永遠是比人弱的,這是不夠的地方。甚至我們在做一些學習系統,我們也要嘗試告訴機器怎麼去描繪一個實物,比如說做人臉模型,王小川長成這樣,大家都認識,但是要描述出來,比如說臉很圓,這個事情也比較不靠譜。是以我們發現我們沒法告訴機器,有了深度學習的方法以後我們确實解決了一個問題,就是隻告訴機器答案,我們給他的資料越原始越好,這件事情會使得程式員、工程師更容易應對專業的問題。因為它可以減少自己的專業背景,不用講說我要去懂人,或者我要像醫生一樣懂得這個片子怎麼看,他是拿資料訓練的。是以在這樣一個深度學習或者是人工智能發展過程中間,由于深度學習本身帶來了好處,技術人員更容易進入到專業領域裡面破解題目,但是這是技術本身。但是對公司而言,公司的領頭人一定是對行業了解比較深刻,對行業應用的時候必須很懂,這是我們講的第二個側面,我不用給機器方法,我給機器答案,機器自己找方法。
alphago代表一個趨勢,我之前跟微軟也在聊這方面,既不給你一個規則,也不給你一個答案,我把自己變成一個判斷者,就像下圍棋一樣,圍棋之前訓練的時候,前三盤棋是把人之前的走棋方法告訴機器,機器就是跟人處于類似的狀态。之後是機器人自己下,我也不知道哪個棋好不好,但是下完之後,人告訴機器這個結果是好還是不好的。人工智能又得到一個新的法門,答案都不需要知道,變得更加省事。
最近有一個消息應該是比較靠譜的,alphago在今年内會跟柯潔打一場比賽,我跑去看了很多評論,以前是一邊倒覺得人會赢,今天一邊倒覺得機器會赢。在座的各位覺得柯潔會赢的有嗎?還有是吧?這是缺乏判斷力的表現。但是我會猜想google會幹什麼新的事,不是簡單地下棋。我有一個猜想,我認為這一次跟柯潔比賽的alphago是沒有經過那三千萬盤棋學習的,因為之前是從kgs裡面拿了人六段到九段的走棋,讓機器在裡面學習,這是跟李世石打比賽用到的。但是跟柯潔比賽我認為是新的,就是兩個從來沒有學習過的機器,然後告訴你赢了、你輸了,什麼都不會的機器訓練一個下棋的規則來,跟柯潔比,如果是所料的這樣就會非常好看,因為以前的機器是仿人的,甚至我們判斷機器走棋走得好不好都是我們的經驗去判斷它。下棋的時候,頭兩局機器赢了,人輸了,媒體的報道說法是中盤逆轉,為什麼叫中盤逆轉?是因為前一半裡面專家态度就是機器走得特别臭,走到一半的時候,發現機器越到中局的時候越好了。這個時候就覺得機器是翻轉局面了。但是後來資料統計,包括google自己說的,其實不是,在他們的視野裡面,機器一直是領先的,隻是以人的眼光覺得機器走得很差,以機器的眼光,它自己走得挺好的。
是以我們對機器的了解是有限的,是以如果機器根本沒跟人學過完全自己的經驗,這次就會有很多新的方法出來。比如慕容複中原的武功學會,然後再去修煉,突然來一個西域的,或者沒有跟中國比賽過的,沒有學過圍棋打法的,我們會遇到這樣的一個問題。是以我内心中,是否用這個程式參加比賽是我的猜想但是google嘗試不用人訓練機器,我蠻佩服的。就好像再重演一次人類的進化史。
我們會好奇哪些職業會被取代,倒過來講就是哪些行業是創業的機會?其實下圍棋的程式,如果把程式突然間跟alphgo說,對不起,我們改點規則,我們把棋盤放成21×21,放大兩個,機器肯定就不會下棋了,但是李世石一定會下。是以機器能做的事情是非常非常有限的。如果說這種題目非常地清晰,就像下圍棋一樣的,輸入的資訊就局限在有限的輸入裡面,在有限的輸入下,有規則清晰的輸出,在這種情況裡面,機器都會把人給取代。是以任務的确定性高,輸入的資訊封閉有邊界,輸出答案是标準可評價的。為什麼呢?棋手已經有了,或者醫生、司機、股票的高頻交易,像這種情況下輸入的資訊非常有限,在資訊非常有限的情況,機器就把人給應了,是以這裡面是機會。難被取代的行業,像創造性的東西,畫家、作家、科研,因為你這樣一個思考的問題是沒有一個邊界的,對機器而言,今天是完全找不到機會去努力的。分析一下哪個行業讓機器更有機會參與,讓人做哪些行業。
技術人員而言,今天發現自己不再是代表人的一方,而是代表讓機器更加聰明,能夠提高機器的效率,能夠看到更廣闊的前景,尤其是做搜尋的公司,做人工智能好像更有優勢,為什麼?因為有很多的資料,比如像芮勇講的要做資料的時候,搜尋機車,找圖檔,沒找到就不會點選了,使用者的點選都會反過來給圖檔做标簽。更多的是搜尋引擎本身就在做初步的人工智能。因為我們看到給你一個關鍵詞你要了解想要什麼,随後能夠給它十條答案。我在了解裡面,人工智能就是底層的基本理念,完全是一緻的。
今天我們看到google往前走的時候,已經開始提更多的理念,他們已經開始在講說已經從移動時代走向人工智能的時代。喬布斯也想得很明白,在走之前說機器能夠在未來學會回答問題,或者接受你的指令去做事。機器裡面是這樣一個輔助的角色,但是很不幸,蘋果的技術能力不夠,或者是時代沒有到,理念很好。
微軟題的一個概念也是做這個事。當然現在很多了,包括google、亞馬遜,大家都開始讓人跟機器以自然語言做溝通,機器服從于人,幫你回答問題,或者是幫你做一些控制指令。這是整個大的背景。我自己也覺得今天我們提網際網路已經不提連接配接,一方面是文化創意産業,一方面是機器變得更聰明,因為有了資料以後,怎麼選擇這個連接配接,做判斷就變得更關鍵。
這兒有一個小的視訊,這是我們公司現在想做的事。
王小川:我的演講就到這裡,謝謝。
王小川,搜狗公司ceo,前搜狐進階副總裁、首席技術官。1994年王小川用吳文俊消元法,首次在微型機下完成初等幾何命題的全部證明。1996年王小川代表中國隊參加第8屆國際資訊學奧林匹克競賽(ioi),獲得金牌,後為中國隊教練。2015年,王小川以“群體智能支撐的網際網路技術及應用”科技成果獲得北京市科學技術獎一等獎;獲得了科技北京百名領軍人才、推動“北京創造”的10大科技人物獎、以及北京市勞動模範稱号。此前王小川還入選了2014年北京市高層次創新創業人才計劃,并獲得了2014年安永中國新興企業家獎等多個獎項。2016年王小川代表搜狗捐贈清華大學1.8億元成立“天工智能計算研究院”,共同緻力于人工智能前沿技術的研究。王小川先生畢業于清華大學計算機專業,擁有工學學士、工學碩士,以及emba學位。
原文釋出時間為:2016-06-09
本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号