教AI打星際2也不難，試試暴雪和DeepMind的工具包 | 附論文+代碼難！難！難！厲害的SC2LE相關資源

2018-01-08 23:50:00

本文來自AI新媒體量子位（QbitAI）

去年年底，DeepMind宣布想教會AI智能體玩《星際争霸2》（後簡稱星際2），計劃創造出能擊敗人類玩家的智能體。

9個多月後這事又有了進展。今天，DeepMind和暴雪娛樂釋出了星際2中加速AI研究的工具SC2LE。

星際2是個實用的基礎AI研究環境，因為遊戲本身複雜多變，且勝利方式不固定。

玩家想要取勝需要同時做多手準備，比如管理并創造資源、指揮軍事機關和部署防禦結構等操作需要同時進行，逐漸完成。此外，玩家還需預測對手的政策。

這項任務确實不容易，但不是無解。DeepMind和暴雪嘗試将遊戲分為多個“迷你遊戲”，将不同任務分解成“可管理的組塊”，比如建立特定單元、收集資源或在地圖上移動等。

細分是為了友善研究人員進行不同任務的測試比較及細化，最終在智能體中組合，進而教會智能體通關整個遊戲。

目前，暴雪和DeepMind在開放的環境平台中加入了SC2LE工具包，加速AI研究。

SC2LE包括——

機器學習API：由暴雪開發，将研究人員和開發人員接入遊戲，并自帶首次釋出的Linux工具包。至此，Windows、Mac與Linux系統均可在雲端運作。

匿名遊戲回放資料集：包含65000多場遊戲記錄，在接下來的幾周将增加至50萬場，幫助實作智能體間的離線比賽。

開源的DeepMindPySC2工具包：友善研究人員使用暴雪的特征層API訓練智能體。

一系列簡單的增強學習迷你遊戲：幫助研究人員在特定任務上測試智能體的性能。

概述開發環境的論文：記錄了迷你遊戲的初始基線結果、監督學習資料以及智能體間完整的對抗記錄。

DeepMind希望通過此舉，推動更多研究社群和開放工具的開發。

如果你也想小試牛刀，不妨移步這些Code與Paper看看——

機器學習API：

https://github.com/Blizzard/s2client-proto

匿名遊戲資料集：

https://github.com/Blizzard/s2client-proto#replay-packs

DeepMind PySC2資料集：

https://github.com/deepmind/pysc2

論文位址：

https://deepmind.com/documents/110/sc2le.pdf

DeepMind官方介紹：

https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/

—— 完 ——

本文作者：安妮

原文釋出時間：2017-08-10

繼續閱讀