深度 | 人工智能的遊戲征途：超級瑪麗簡直小菜一碟，星際争霸、LOL才是大boss

人類玩家依然能在類似《星際争霸》這樣的遊戲中奪冠

ap photo/david goldman

“深藍”打敗人類距今已有20年，離 alphago和李世石的世紀圍棋之戰也已經過去了半年時間。而如今，人工智能的下一個目标是遊戲。

ai 研究者為何偏愛遊戲？遊戲是一項複雜、接地氣而又充滿挑戰的項目，基于上述特性，如果攻克了遊戲，人工智能未來很有可能夠解鎖更多的應用領域。正如 alphago 的締造者 demis hassabis 所言：遊戲“就像一塊為研究者提供無限算法嘗試的試驗田，測試它們的能力上線，并且能以高效的方式觀察人工智能的表現。最終我們能一葉知秋，将人工智能的能力推演到廣闊的真實世界。”

半年前，alphago 戰勝了圍棋大師李世石，轟動一時。但在 hassabis 眼裡，這個有着近乎無窮可能的棋類遊戲和《星際争霸》比起來，還隻是小菜一碟——他将《星際争霸》稱為“更上一層樓”。

負責 google brain 的谷歌工程師 jeff dean 則認為，《星際争霸》是我們下一個要攻占的堡壘。

《星際争霸》是暴雪娛樂于 1998 年推出的一款即時戰略遊戲，玩家可以在三個種族中選擇其一，在特定地圖上采集資源，生産兵力，并摧毀對手的所有建築以取得遊戲勝利。

那麼問題來了：為何 ai 研究者們會相中這款遊戲呢？

首先，它的遊戲規則十分複雜，為了赢得勝利，玩家需要制定高水準的政策，并且需要在上百場對抗中快速做出大量決定。

此外，《星際争霸》風靡全球，幾乎可以算得上是職業競技的遊戲鼻祖，南韓在 21 世紀以來也已經開設職業的遊戲比賽。而在 2010 年後，每年，aaai人工智能與互動式數字娛樂年度會議(aiide)都會協辦一場計算機程式玩《星際争霸:母巢之戰》的比賽，而這甚至得到了暴雪的支援。

如果抛開這些不談，如果讓《星際争霸》的機器程式與人類對抗，前者實際上就是炮灰，因為它們傾向于采用低水準的互動政策，而不擅長高水準的戰略制定，而在瞬息萬變的實際對抗中，機器程式完全無法領略“見風使舵”的精髓。

這也就難怪紐約大學遊戲研究中心總監 julian togelius 如是說：“雖然我們制定了一系列程式和法則，但在實戰中的确不堪一擊。”

在 2015 年的比賽中，人類玩家 djem5

在找到對方一處毫無防禦的根據地後，順利打敗了機器 tscmoo

aiide

對于研發遊戲機器的團隊而言，要戰勝人類還任重道遠。盡管機器已經足夠出色，但就算仰仗着大公司的扶植，機器人們還處于“隻可 solo 不可對戰”的狀态。

這誠然是一個很有意思的問題，除了谷歌，facebook 和微軟研究院也刊發了研究《星際争霸》的論文。

“大公司的人工智能領域對《星際争霸》的興趣已得到了越來越多的關注，如果能夠花時間和精力拿下這個難題，研究的進度将會是質的突破。” 紐芬蘭紀念大學的計算機科學教授 david churchill如是說，他自己也在帶領一個研究人工智能玩《星際争霸》的團隊。

即使大公司們都已經抱以密切關注，要搞定《星際争霸》也絕非易事。深度學習是一項需要大量資料支援，讓機器學會尋找“套路”的技術，而谷歌的核心在于找到突破點，先從簡單的遊戲開始研究。這一點讓 facebook 研究院取得突破。

togelius 表示，“我覺得要讓機器學會玩《星際争霸》有點難，畢竟在玩這個超級複雜的遊戲前，你需要定制一個完善的作戰計劃，但算法和網絡目前還不能滿足這樣的要求。”

既然在《星際争霸》上折戟沉沙了，那麼 ai 玩不玩得轉其他遊戲呢？

就拿回合制政策遊戲《文明5》來說，ai 想獲得遊戲勝利需要運用與《星際争霸》類似的政策，該遊戲需要更加複雜的長遠規劃，但戰鬥中的細微操作則要少得多。

churchill 表示：“我認為像《文明5》這樣的遊戲，ai 玩起來要比《星際争霸》更加輕車熟路。”

回合制政策遊戲《文明5》

2k games/firaxis

那麼衆多玩友熟悉的《英雄聯盟》呢？在這款隻需控制單個英雄進行對戰的遊戲中，ai 能否充當放假“國小生”的角色呢？

churchill 表示：“我見過很多聲稱 ai 能輕易擊敗世界冠軍的技術大牛，不過我覺得事情可沒那麼簡單。”

togelius 則認為“雖然 ai 打 lol 不需要那麼多層級的操作，但想要獲勝，依然需要背後技術團隊的支援，其開發過程必定相當複雜。”

網友熟悉的《英雄聯盟》

youtube/riot

說完了戰略類遊戲，我們現在轉入男性使用者深愛的體育類遊戲。拿足球遊戲界能與《實況足球》分庭抗禮的《fifa》來說，ai 想要進球獲勝，也需要精确排程場上的 11 名隊員，其中的球路變換可不比《星際争霸》少。

“場上共有 11 名隊員，即使每個隊員隻會做 4 個動作，整場下來出現的變化情況可能就會超過 400 萬種。”togelius 說道。與其相比，國際象棋每一步都有 35 種變換，而圍棋則高達 300 種。

對于第一人稱射擊遊戲（fps），ai 則更容易 hold 住，因為它們隻需保證設計的準頭就行。也許未來在玩此類網遊時，爆你頭的就是 ai 了。

當然，也有人不同意這種看法，對于 fps 高手來說，隻有準頭還不夠，在比賽中配合和各種“風騷”的走位也是必須的。

再将時間向前推十幾年，ai 能在當時經典的格鬥遊戲《街頭霸王》中占據優勢嗎？答案是肯定的，這款遊戲對 ai 來說簡直小菜一碟。

“這款遊戲靠的就是極快的反應，畢竟天下武功唯快不破，而電腦的反應總比人要快。” togelius 說道。

古老的平台遊戲就更加簡單了，對 ai 來說，經典的《超級馬裡奧》簡直不在話下。

2009 年的 ai 就能直接玩爆《超級馬裡奧》了

robin baumgarten

togelius 認為角色扮演遊戲可能會有些棘手，就拿《上古卷軸》來說，ai 在通關過程中需要了解角色間的對話，這需要較強的認知能力。

說了這麼多遊戲，怎麼能忘了經典的卡牌遊戲，它們依然是益智聖品呢。其實 ai 早就解決了兩人對戰的德州撲克，但一旦玩家多起來并加入多種賭注，ai 就蒙圈了。在攻克著名的益智遊戲橋牌時，ai 在欺騙性打法、叫牌和記牌的能力上也略遜一籌，它依然是世界冠軍的手下敗将。

另外，國外許多人癡迷的拼字遊戲也屬于 ai 的能力範圍之外。

許多年前，togelius 就在 ai 研發時發現了一個問題：在遊戲通關的目标下，人們更注重如何獲勝，是以在程式設計時他們就忘了人工智能的真谛。

“為了獲勝，人們在程式設計時傾向性更強。在賽車遊戲裡，程式設計人員更注重 ai 的賽車能力，他們把所有的技術細節都細化到了每一個角色中。這樣的 ai 赢是能赢，但卻沒有做到一專多能。”togelius 說道。

正是這一原因讓 togelius 在2014年走上了通用遊戲 ai（gvgai）的競賽之路。在這場競賽中，選手設計的 ai 需要在未知的10款遊戲中對戰。要想獲勝，ai 就必須擁有強悍的靈活性和适應性，而這正是人類的優勢。

“通用智能并不是針對解決某種問題開發的，相反，它有解決各種問題的能力。”togelius 說道。

不過，gvgai 中的 ai 現在離終極目标還是有些遠。

“在大多數遊戲中，它們都達不到人類玩家的水準。”togelius 說道。“不過在簡單的射擊遊戲，如《太空侵略者》中，ai 就能不費吹灰之力的獲勝。但一旦需要長遠的規劃，它們就會敗下陣來。”

不過，togelius 認為 ai 的進步還是挺神速的，假以時日必成大器。此外，剛剛在圍棋界打遍天下無敵手的 deepmind 也要來玩遊戲了。

老式電子遊戲《太空侵略者》早已被 ai 攻克

midway

那麼未來的遊戲戰隊會成為 ai 的專屬領地嗎？專家不同意這個觀點，他們認為人機配合才是未來電子競技的主旋律。

togelius 表示：“以棋類遊戲為例，人類可以負責做長遠的戰略規劃，而電腦則可以負責在細節處對人類棋手的決策進行指導。”這樣的強強合作在《星際争霸》等複雜遊戲中就可适用。

“想像一下，如果未來人機強強聯合組成《星際争霸》戰隊，絕對可以無往不利。人類負責為它們做出進階别的戰略規劃，而 ai 則可以負責精确執行人類的指令。”togelius 說道。“同時，我覺得這也是未來 ai 的發展道路，人類不會将控制權完全交給 ai ，它們隻是社會中必不可少的助手。”

深度 | 人工智能的遊戲征途：超級瑪麗簡直小菜一碟，星際争霸、LOL才是大boss

繼續閱讀

K-近鄰算法以及圖像分類應用

小i機器人受邀赴韓交流，CFO首爾亞洲金融論壇演講

吳恩達deeplearning

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普