本文來自AI新媒體量子位(QbitAI)
去年年底,DeepMind宣布想教會AI智能體玩《星際争霸2》(後簡稱星際2),計劃創造出能擊敗人類玩家的智能體。
9個多月後這事又有了進展。今天,DeepMind和暴雪娛樂釋出了星際2中加速AI研究的工具SC2LE。
星際2是個實用的基礎AI研究環境,因為遊戲本身複雜多變,且勝利方式不固定。
玩家想要取勝需要同時做多手準備,比如管理并創造資源、指揮軍事機關和部署防禦結構等操作需要同時進行,逐漸完成。此外,玩家還需預測對手的政策。
這項任務确實不容易,但不是無解。DeepMind和暴雪嘗試将遊戲分為多個“迷你遊戲”,将不同任務分解成“可管理的組塊”,比如建立特定單元、收集資源或在地圖上移動等。
細分是為了友善研究人員進行不同任務的測試比較及細化,最終在智能體中組合,進而教會智能體通關整個遊戲。
目前,暴雪和DeepMind在開放的環境平台中加入了SC2LE工具包,加速AI研究。
SC2LE包括——
機器學習API:由暴雪開發,将研究人員和開發人員接入遊戲,并自帶首次釋出的Linux工具包。至此,Windows、Mac與Linux系統均可在雲端運作。
匿名遊戲回放資料集:包含65000多場遊戲記錄,在接下來的幾周将增加至50萬場,幫助實作智能體間的離線比賽。
開源的DeepMindPySC2工具包:友善研究人員使用暴雪的特征層API訓練智能體。
一系列簡單的增強學習迷你遊戲:幫助研究人員在特定任務上測試智能體的性能。
概述開發環境的論文:記錄了迷你遊戲的初始基線結果、監督學習資料以及智能體間完整的對抗記錄。
DeepMind希望通過此舉,推動更多研究社群和開放工具的開發。
如果你也想小試牛刀,不妨移步這些Code與Paper看看——
機器學習API:
https://github.com/Blizzard/s2client-proto
匿名遊戲資料集:
https://github.com/Blizzard/s2client-proto#replay-packs
DeepMind PySC2資料集:
https://github.com/deepmind/pysc2
論文位址:
https://deepmind.com/documents/110/sc2le.pdf
DeepMind官方介紹:
https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/
—— 完 ——
本文作者:安妮
原文釋出時間:2017-08-10