天天看点

阿里开源强化学习研究平台Gym StarCraft

星际争霸一直是游戏玩家心目中即时战略类的经典之作,历时十多年而不衰。而如今它更成为深度强化学习、人工智能算法研究的一个主要平台和工具。因为其蕴含了多智能体协作、多任务学习、宏观策略规划等复杂问题,一旦取得部分突破和进展,对商业和社会发展都会带来极大影响。如国外的deepmind、facebook等公司相继投入大量人力基于它进行通用人工智能的研究。

阿里开源强化学习研究平台Gym StarCraft

在星际争霸的ai研究中,一直以来缺乏完善的工具链和开发环境。今年年初facebook公司发布的torchcraft打通了星际和torch之间的桥梁,但却不支持主流的python开发语言和tensorflow深度学习框架;早前openai公司发布的gym算法平台虽然支持众多游戏环境下的算法验证和对比测试,但却缺少对星际的支持。

阿里巴巴作为国内领先的大数据、云计算公司,对以强化学习为代表的人工智能技术密切关注并投入巨大。针对星际ai的这一现状,率先开发了一套专业易用的研究平台gym starcraft,并且已经开源。

在gym starcraft中,ai和强化学习研究者可以非常方便地使用python语言来进行深度强化学习智能agent的开发,它底层完成了对torchcraft和openai gym的封装,支持基于tensorflow和keras等主流算法框架进行开发,仅需几十行代码即可完成一个基本的智能agent的开发。同时,便于评测智能agent的有效性,gym starcraft被集成在了openai gym这一主流的强化学习ai评测平台中,支持世界各地的星际ai研究者基于它去进行公平、快捷的效果评估,提供了一个人工智能的开放协作研究平台。

<a href="https://mp.weixin.qq.com/s/mpn5vmotzvdj_aaq-zkreg">原文链接</a>