嘉賓介紹:
王小川,搜狗公司CEO,前搜狐進階副總裁、首席技術官。1994年王小川用吳文俊消元法,首次在微型機下完成初等幾何命題的全部證明。1996年王小川代表中國隊參加第8屆國際資訊學奧林匹克競賽(IOI),獲得金牌,後為中國隊教練。
2015年,王小川以“群體智能支撐的網際網路技術及應用”科技成果獲得北京市科學技術獎一等獎;獲得了科技北京百名領軍人才、推動“北京創造”的10大科技人物獎、以及北京市勞動模範稱号。此前王小川還入選了2014年北京市高層次創新創業人才計劃,并獲得了2014年安永中國新興企業家獎等多個獎項。
2016年王小川代表搜狗捐贈清華大學1.8億元成立“天工智能計算研究院”,共同緻力于人工智能前沿技術的研究。王小川先生畢業于清華大學計算機專業,擁有工學學士、工學碩士,以及EMBA學位。

我今天的題目是《AlphaGo的幕後與思考》。大家可以看道這張圖顯示的是人機大戰中4:1的比分。我的了解是一個學術與市場營銷的完美的結合。全中國人,估計95%都知道這樣一場比賽,而且這場比賽也徹底颠覆了我們對技術、對人工智能的了解。
為什麼這麼說呢?
我先用一個詞,Google背後的心機。Google在今年1月份在《自然》雜志上發表了一篇文章,講的是跟樊麾打一場比賽,比賽前跟樊麾簽了一個協定,不管結果是輸是赢,不能對外透露任何細節,要嚴格保密的。假設谷歌沒有發論文,先跟樊麾比賽,能有多大學術的高度?
對于大多數人來講,光看論文是沒有感覺的。但是谷歌的團隊心思之缜密,不僅是在做研究的這群人,還把事情推到特别大的高度。另外他們為什麼選樊麾?如果谷歌選一個職業選手,但是沒有世界冠軍頭銜,我們覺得挺LOW。找一個世界冠軍,挺高的頭銜,但對專業選手而言,僅有二段,不算高手。
是以,在這件事上,我覺得谷歌既把眼球吸引到了,又留給大家想象和争論的空間。
比賽之前大家是什麼心态呢?
比如聶衛平覺得計算機一點機會都沒有,這是不可克服的問題,認為機器能夠下棋是沒有判斷力的表現。甚至還有中國隊的圍棋總教練俞斌,他是在圍棋界裡面計算機學得最好的,在80年代自己寫下圍棋的計算機程式,得到很多認可。他認為機器是一點機會沒有的,因為我認為計算機有它不可克服的問題,人和電腦相比,根本沒有勝負,100%是人赢。
我想在這裡面能夠看到人性當中脆弱的一面,每個人都有,每個人生病的時候都有自己的壓迫,别人說你特蠢,東西做得爛,大家都不開心。每個人都有自尊心。這件事一定會把一部分人放在曆史舞台的對立面。圍棋選手今天很不幸,在下棋上有這樣的問題。
計算機的問題怎麼講?
比如李開複講認為AlphaGo比較懸,但是未來能赢,IT界的人不會說機器幹不過人,否則存在感就沒有了。但是通常都認為機器沒有這麼快,以後會赢得。在這個比賽中,大多數搞技術的人都沒有感覺到這個事情發生的速度。
2月份的樣子,我在知乎上發帖,說這次AlphaGo會完勝。因為它滿足了張钹院士講的三個條件:
第一、提出了問題。人工智能在下棋上是一個重大的事,好多人沒有想這個方向。
第二、我看到它會赢。
第三、我知道為什麼會赢。
我認真地讀了論文,找了下圍棋的人請教,鬥膽發了這樣一篇文章,是有勇氣的,最後也被驗證成功了。理想跟現實之間差别是很大的,對于這樣一個技術趨勢裡面,我覺得我是有判斷的,但是市場股價沒辦法思考。
比賽前到比賽後就是七八天時間,給AlphaGo取了一個新的名字,叫“阿老師”,我們特别希望中國有人做出這樣的阿老師,把它當老師看。
在比賽前、比賽後,我們對機器的了解裡面産生了巨大的變化,我們開始接受它,把它拟人化,而且比分很巧妙,4:1,如果赢五局可能就不好了,不是圍棋選手被滅了,是人類被滅的感覺。
印刷術建立之後,我們開始探讨人和人之間的關系。就像文藝複興是從封建社會到資本主義社的分水嶺。咱們中國現在還沒經曆這個運動,是以有一點點問題。
AlphaGo之後,帶來我們重新的思考,就是機器和人的關系。有專家會講機器還不行,有人講機器以後會颠覆人類。
我們以前認為機器就是機器,拔電源就行了。診斷報告是機器給做的,說你這個人有什麼問題,看片子還得找專家。但是在今天,照完片子之後,機器的診斷效果可能比人更準。我有一個醫學朋友,做CT看片子的,他說大多數醫生看片子的準确率是40%,他現在到70%,已經高很多了。
我們今天接受機器的很多判斷。這是我們的心理上一個巨大的變化,我把它稱為“第二次人類自己的運動”。
關于人工智能,打擊都有很多想法。做産品的時候,就是想機器怎麼能在裡面做決策、識别。決策就分了三個層次。
第一層,将傳統方法交給機器。
第二層,将答案交給機器記憶學習。
第三層,将目标給機器自我學習。
這是我自己的了解,也跟AlphaGo脈絡一緻。最早的專家系統是第一個,我們把規則交給機器,把計算機世界變成一個邏輯,告訴機器,這是原來的階段。
這個階段裡的重大的問題就是我們沒法去教機器,不知道怎麼描述的時候,機器就不靈了,而且教出來的徒弟永遠是比人弱的,這是不夠的地方。甚至在做一些學習系統中,我們也要嘗試告訴機器怎麼去描繪一個實物,比如說做人臉模型。王小川長成這樣,大家都認識,但是要描述出來,比如說臉很圓,這個事情也比較不靠譜。是以我們發現我們沒法告訴機器。
有了深度學習的方法,我們解決了一個問題,就是隻告訴機器答案,給的資料越原始越好,這會使得程式員、工程師更容易應對專業的問題。因為它可以減少自己的專業背景,不用講說我要去懂人,或者像醫生一樣懂得片子怎麼看,是拿資料訓練的。
在這樣一個深度學習或者是人工智能發展過程中,深度學習本身帶來了好處,技術人員更容易進入到專業領域破解題目,這是技術本身。
對公司而言,公司的領頭人一定是對行業了解比較深刻,很懂行業應用,這是我們講的第二個側面。不用給機器方法,隻給答案,機器自己找方法。
AlphaGo代表一個趨勢,既不給規則,也不給答案,把自己變成一個判斷者,就像下圍棋一樣。圍棋之前訓練的時候,前三盤棋是把人之前的走棋方法告訴機器,機器跟人處于類似的狀态。之後機器人自己下,不知道哪個棋好不好,下完之後,人告訴機器這個結果好不好。人工智能又得到一個新的法門,答案都不需要知道,變得更加省事。
最近有一個消息應該是比較靠譜的,AlphaGo在今年内會跟柯潔打一場比賽,我跑去看了很多評論,以前是一邊倒覺得人會赢,今天一邊倒覺得機器會赢。
我有一個猜想,我認為這一次跟柯潔比賽的AlphaGo是沒有經過那三千萬盤棋學習的,因為之前是從KGS裡面拿了人六段到九段的走棋,讓機器學習,這是跟李世石打比賽用到的。
但是跟柯潔的比賽我認為是新的,兩個從來沒有學習過的機器,然後告訴你赢了、你輸了,什麼都不會的機器訓練一個下棋的規則來。以前的機器是仿人的,我們判斷機器走棋走得好不好都是經驗去判斷。
下棋的時候,頭兩局機器赢了,人輸了,媒體的報道是中盤逆轉。為什麼叫中盤逆轉?因為前一半裡專家的态度是機器走得特别臭,走到一半的時候,機器越到中局的時候越好了。這個時候就覺得機器是翻轉局面了。
後來資料統計說,在他們的視野裡面,機器一直是領先的,隻是以人的眼光覺得機器走得很差,以機器的眼光,它走得挺好的。是以我們對機器的了解是有限的。比如慕容複中原的武功學會,然後再去修煉,突然來一個西域的,或者沒有跟中國比賽過的,沒有學過圍棋打法的,我們會遇到這樣的問題。是否用這個程式參加比賽是我的猜想但是Google嘗試不用人訓練機器,我蠻佩服的。
哪些職業會被取代,倒過來講就是哪些行業是創業的機會?
在下圍棋的程式中,如果把程式突然間跟AlphGo說,對不起,我們改點規則,把棋盤放成21×21,放大兩個,機器肯定就不會下棋了,但是李世石一定會下。是以機器能做的事情是非常有限的。
如果說題目非常清晰,就像下圍棋一樣,輸入的資訊就局限在有限的輸入,有規則清晰的輸出,在這種情況裡,機器會把人取代。
任務的确定性高,輸入的資訊封閉有邊界,輸出答案是标準可評價的。像醫生、司機、股票的高頻交易,輸入的資訊有限的行業裡,機器學習是有很大機會的。一些創造性的行業,像畫家、作家、科研等等,思考的問題沒有邊界,對機器而言,完全找不到機會努力。
技術人員讓機器更加聰明,提高機器效率,能夠看到更廣闊的前景。做搜尋的公司,做人工智能好像更有優勢,為什麼?因為有很多的資料,像芮勇講的要做資料的時候,搜尋機車,找圖檔,沒找到就不會點選了,使用者的點選都會反過來給圖檔做标簽。更多的是搜尋引擎本身就在做初步的人工智能。輸入一個關鍵詞,随後給出十條答案。是以,人工智能就是底層的基本理念。
今天我們看到Google往前走的時候,開始提更多的理念,從移動時代走向人工智能的時代。喬布斯也曾說機器能夠在未來學會回答問題,或者接受指令去做事。當然,包括Google、亞馬遜,都開始讓人跟機器以自然語言做溝通,機器服從于人,回答問題,或者幫你做一些控制指令。這是整個大的背景。今天我們提網際網路,一方面是文化創意産業,一方面是機器學習。有了資料以後,怎麼選擇這個連接配接,做判斷就變得更關鍵。
我的演講就到這裡,謝謝。
原文釋出時間為:2017-03-04
本文來自雲栖社群合作夥伴“資料派THU”,了解相關資訊可以關注“資料派THU”微信公衆号