天天看點

馬斯克OpenAI版“阿爾法狗”完勝最強人類選手

作者:DeepTech深科技

8 月 11 日,人工智能又給人類帶來了驚喜,伊隆·馬斯克(Elon Musk)旗下的人工智能研究機構 OpenAI 宣布他們所打造的一個 AI 機器人已經在電子競技遊戲 Dota 2 中擊敗了一個名為 Dendi 的人類職業玩家,而比賽所采取的形式也是很直接的 1v1。

馬斯克OpenAI版“阿爾法狗”完勝最強人類選手

雙方約定好共進行三輪比賽,在第一場比賽中,人工智能在不到十分鐘的時間内閃電擊敗對手;第二場比賽同樣也是由人工智能取得了勝利;而這直接導緻了 Dendi 放棄進行第三場比賽。

馬斯克OpenAI版“阿爾法狗”完勝最強人類選手

圖丨被AI打敗的Dota2最強人類選手Dendi

“這個家夥很可怕,”Dendi 在比賽中倒吸了一口冷氣。

馬斯克OpenAI版“阿爾法狗”完勝最強人類選手

圖丨馬斯克第一時間轉發了OpenAI獲勝的消息

OpenAI 官方解釋說,這款 AI 機器人是完全通過自我訓練出來的,研究人員從零開始通過過往的比賽視訊來對它進行訓練。OpenAI 的 CTO 格雷格·布羅克曼(Greg Brockman)表示,訓練僅僅花費了兩周的時間,AI 就已經擊敗了包括世界排名第一在内的頂級 1v1 選手。

Brockman 補充道,“通過 1v1 這種形式的訓練,我們已經針對 AI 的優勢和劣勢進行了針對性的訓練。”接下來,OpenAI 将訓練 AI 一次扮演 5 個選手,這樣就可以組成一個完整的戰隊了。同時,他們還準備将這款 AI 對外開放,讓所有人都有機會和人工智能進行對戰。

而人工智能介入遊戲領域也并非新鮮事,包括 DeepMind 和 Facebook 都已經針對即時戰略遊戲“星際争霸2”開展了探索之路,他們收集大量的人類玩家遊戲比賽記錄資料,并用這些資料來訓練深度學習算法,最終可以做到在人機大戰中擊敗人類選手。

就在 8 月 10 日,DeepMind 聯合暴雪公司正式推出合作開發的星際争霸2機器學習工具組:SC2LE(星際2學習環境),雙方希望通過這些工具,幫助研究人員加快星際争霸 2 AI 的開發速度。

SC2LE 包括:

一個由暴雪開發的機器學習API,為研究人員和開發者們提供接入遊戲的端口。其中将首次完整包含為Linux系統開發的工具。(GitHub 位址:https://github.com/Blizzard/s2client-proto)

DeepMind的工具集PySC2的開源版,讓研究人員可以輕松地在各自的模型中使用暴雪的特征層API。(GitHub 位址:https://github.com/deepmind/pysc2)

一系列小遊戲,讓研究人員可以對自己系統的性能進行真實的測試。

一個含有6萬5千局匿名遊戲的資料集,并将在接下來的幾周裡擴充至50萬局遊戲以上。

一篇介紹整個環境并提供基線成績的論文。基線成績是由小遊戲,從遊戲回放進行的監督學習,以及與星際2 自帶的電腦對手進行單挑的結果得出的。(論文位址:https://deepmind.com/documents/110/sc2le.pdf)

馬斯克OpenAI版“阿爾法狗”完勝最強人類選手

當然,星際争霸 2 還有一些難題暫時沒有技術手段解決,比如“戰略”。作為一個戰略遊戲,很多時候,玩家做出的決定往往隻會在十幾甚至幾十分鐘之後才會産生效果。是以,為了讓 AI 學會“戰略”,它必須擁有“計劃”和“記憶”的能力。“存儲是至關重要的”,DeepMind 星際争霸 2 項目的負責人Oriol Vinyals 說道。

而由于遊戲的長度,DeepMind善用的加強學習卻并不适合星際争霸 2,“我現在做出的操作可能在很久之後才有後果”,Vinyals說道。由于現有的技術手段無法攻克這一難題,DeepMind 希望降低開發星際争霸 2 AI 的門檻,集衆人之力開發出新的技術手段,解決“戰略”難題。

可以說,DeepMind 和暴雪聯合開發的工具一舉打開了通往終極星際争霸2 AI 的大門。目前,已經有數名世界頂級星際2選手表示,願意與AI一戰。

除了星際争霸2,更值得一提的就是在此之前火遍全球的“AlphaGo”熱潮,在圍棋這個最複雜的棋盤遊戲中,人工智能已經将包括柯潔在内的人類最頂尖的棋手都一一擊敗,這甚至在當時還一度使“AI威脅”的論點甚嚣塵上。

馬斯克OpenAI版“阿爾法狗”完勝最強人類選手

圖丨馬斯克認為 Dota2 的難度比象棋和圍棋大得多

雖然我們還無法評價 OpenAI 的這次實驗與 Facebook 和 DeepMind 打造的“星際争霸II” AI 以及 DeepMind 的圍棋 AI AlphaGo 孰優孰劣。但到目前為止,的确還沒有人工智能研究團隊可以擊敗人類遊戲玩家,OpenAI 算是開了個先河。

不過,這對于人類來說可能就沒有那麼樂觀了,“感覺它就像人類選手一樣,但又有人類所不具備的優勢,”Dendi 對 OpenAI 的人工智能做出了這樣的評價。