天天看點

回顧人工智能大爆炸的引爆點(The origin of the AI big bang)

2016年開始,Google的人工智能項目AlphaGo連續給人類三連擊,堪稱人工智能領域的氫彈,超越了人類認知的極限,讓人類真正認識到了人工智能的真實實力和無限潛力,引發人工智能技術在全世界範圍内的大爆發。

為什麼人工智能戰勝人類圍棋大師會産生如何重大的影響呢?

圍棋有着3000多年的曆史,起源于中國,是智者的遊戲,是高雅的藝術。在亞洲有着很深厚的文化意義。今天,全世界有4000萬人在玩圍棋,有超過2000多個頂級專家。圍棋隻有兩個非常簡單的規則,而其複雜性卻是難以想象的,一共有10的170次方種可能性,這個數字比整個宇宙中的原子數10的80次方都要多的多,是沒有辦法窮舉出圍棋所有的可能結果的。人工智能解決圍棋問題的主要挑戰有搜尋空間巨大,圍棋有200個分支因數,平均每一個棋子有兩百個可能的位置,而象棋僅僅是二十個。幾乎沒有一個合适的評價函數來定義誰赢了,赢了多少。一個小部分的小變動,會導緻整個格局的完全變化,是以每一個小的棋子都對棋局有着至關重要的影響。這種深度和廣度,是人類最精妙算法都無法準确定義和判斷的,圍棋是最能代表人類智慧高度的遊戲,最緻命的一招往往要靠人的潛意識和直覺,這是一種藝術、一種美或哲學,是不可捉摸的,也沒有辦法解釋的。人們意識到這需要用計算機模拟人腦的原理來對決才可能成功,最終AlphaGo成功了。

第一擊“突破” Google的AlphaGo戰勝人類圍棋大師。

2016年1月27日,國際頂尖期刊《自然》封面文章報道,谷歌AlphaGo人工智能在沒有任何讓子的情況下,以5:0完勝歐洲圍棋冠軍、職業二段選手樊麾。這是圍棋人工智能領域的一次史無前例的突破。計算機程式能在不讓子的情況下,第一次實作在完整的圍棋競技中擊敗職業圍棋選手。

第二擊“秒殺” AlphaGo挑戰世界圍棋冠軍李世石。

2016年3月,AlphaGo以4比1的總比分戰勝世界圍棋冠軍李世石,在比賽開始之前,世界上幾乎每個人(包括李世石自己)都認為李世石一定會很輕松就打赢這五場比賽,實際結果是AlphaGo以4:1獲勝。這是一個大多數圍棋專家和人工智能領域的專家都根本沒想到的結果。值得稱道的是李世石使出堪稱《棋魂》漫畫中的“神之一手”赢下一局,為人類戰勝AlphaGo留下了一絲希望。李世石在第四場的時候做出了一步非常創新性的一招,這可能是圍棋史上有巨大曆史意義的創新之舉,是中國古代所稱的蘊含哲理的“黃金之舉”,這是圍棋的頂級專家和職業棋手用盡必生的精力去找出的“神之一手”。 在這一步裡,AlphaGo當時估計李世石通過這步赢的可能性是0.007%,但AlphaGo知道這是非常不尋常的一步,因為AlphaGo之前沒有見過這樣的落子方式,在那2分鐘裡,他需要重新搜尋決策計算。

這場比賽對于DeepMind團隊來說也是一生僅有一次的偶然事件。全世界28億人在關注,35000多篇關于這場比賽的報道。整個南韓那一周都在讨論這個話題。這場比賽雖然最終是人類輸了,但是這場比賽又反過來極大的促進了圍棋在全世界的發展,西方網售的圍棋被一搶而空,美國麻省理工學院MIT還有其他很多高校的很多人新加入了圍棋社。

第三擊“碾壓”AlphaGo戰勝現在排名世界第一的柯潔和數十位人類頂尖圍棋高手,碾壓人類職業圍棋選手。

2016年12月29日晚起到2017年1月4日晚,AlphaGo在弈城圍棋網和野狐圍棋網以“Master”為注冊名,依次對戰數十位人類頂尖圍棋高手,取得60勝0負的輝煌戰績。這一情形非常像漫畫《棋魂》中隐藏在網路上的棋士Sai,大家都想知道網上的棋手Sai到底是誰。2017年5月23日到27日,在中國烏鎮圍棋峰會上,AlphaGo以3比0的總比分戰勝排名世界第一的世界圍棋冠軍柯潔。2017年5月26日,AlphaGo還戰勝了由陳耀烨、唐韋星、周睿羊、時越、芈昱廷五位世界冠軍組成的圍棋團隊。

“進化” AlphaGo Zero擺脫人類經驗積累,甩開人類圍棋水準

2017年10月19日淩晨,在國際學術期刊《自然》(Nature)上發表的一篇研究論文中,谷歌下屬公司Deepmind報告新版程式AlphaGo Zero:從空白狀态學起,無需任何人類輸入,它能夠根據基本的圍棋規則迅速自學圍棋,經過短短3天的自我訓練,AlphaGo Zero就強勢打敗了此前戰勝李世石的舊版AlphaGo,戰績是100:0的。經過40天的自我訓練,AlphaGo Zero又打敗了AlphaGo Master版本。“Master”曾擊敗過包括世界排名第一的柯潔在内的許多世界頂尖的圍棋選手。

AlphaGo Zero已經不再需要人類千百年來積累的圍棋對弈經驗輸入,她可以從零開始,自學成才,而且是超級快速的自我進化,秒殺自己的前輩,AlphaGo Zero的棋局已經不是現在人類可以了解的了,沒有定式,不需要記棋譜,人類可以說是在與圍棋之神對弈了。在亞洲,如果一個孩子在很小的時候就展示了圍棋的天賦,這些小孩将會被父母培養并被選中進入專業的圍棋學校,在那裡,學生從6歲起,每天花12個小時學習圍棋,一周七天,每天如此。直到他成為這個領域的專家,才可以離開學校畢業,這些專家投入人生全部的精力,通過不斷的訓練去揣摩學習掌握這門技術,但人類最多也就是數十年學習積累,最多數萬盤對弈的水準。AlphaGo Zero把圍棋提升到神的級别了,遠遠甩開了人類水準,就像是人類從地球離開進入了太空,進入了一片充滿未知的新空間。AlphaGo Zero已經可以教人類下棋了,問題在于人類大腦是否能夠真正了解呢?樊麾說在和AlphaGo對決的過程中,機器人不斷創新的下法,也讓人類不斷跳出自己的思維局限,提高了自己的水準。職業棋手經過圍棋學校裡30多年的專業訓練,他們的很多思維已經固化并形成定式,機器人的創新想法能為其帶來意想不到的靈感。柯潔比賽之後說人類已經研究圍棋研究了幾千年了,然而人工智能卻告訴我們,我們甚至連其表皮都沒揭開。他也說人類和人工智能的聯合将會開創一個新紀元,将共同發現圍棋的真谛。

DeepMind創始人,AlphaGo之父傑米斯·哈薩比斯(Demis Hassabis)說他真的相信如果人類和機器人結合在一起,能創造出許多不可思議的事情。我們的天性和真正的潛力會被真正釋放出來。

我想AlphaGo讓人類認識到自己的局限,讓人類棋手重新開始去突破認知的極限,去尋找圍棋的真理,同樣的道理,人工智能技術解放了人類的大腦,人工智能在科學探索和技術研究中會幫助人類突破極限,讓人類有更大的能力和無限的潛能去尋找科學的真理。

繼續閱讀