gym的簡介
gym是開發和比較強化學習算法的工具包。它對代理的結構不做任何假設,并且與任何數值計算庫(如TensorFlow或The.)相容。gym庫是一個測試問題的集合-環境-你可以用來制定你的強化學習算法。這些環境有一個共享的接口,允許您編寫一般的算法。
(1)、OpenAI 的gym庫,它可以為我們提供常用的強化學習環境。
gym算法:
https://gym.openai.com/envs/#algorithmic使用細節:
https://gym.openai.com/docs/檢視目前Gym 庫支援的所有環境:
https://gym.openai.com/envs/pypi gym:
https://pypi.org/project/gym/gym的安裝
pip install gym
![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLicmbw5CNxcjM3ImM3ETO0cjZwYTOlZGN0QjMlZTM5I2N2YDZl9CX5d2bs92Yl1iclB3bsVmdlR2LcNWaw9CXt92Yu4GZjlGbh5yYjV3Lc9CX6MHc0RHaiojIsJye.png)
gym的使用方法
1、測試
import gym
env = gym.make('CartPole-v0')
env.reset()
for _ in range(1000):
env.render()
env.step(env.action_space.sample()) # take a random action