OpenAI Gym学习
求助,安装openai gym all老是出错?
在强化学习中有2 个基本概念,一个是环境(environment),称为外部世界,另一个为智能体agent(写的算法)。agent 发送action 至environment,environment返回观察和回报。而OpenAI Gym 的核心接口是Env,作为统一的环境接口。Env 包含以下核心方法:
env.reset(self):重置环境的状态,返回观察
env.step(self,action):推进一个时间步长,返回observation,reward,done,info
env.render(self,mode=’human’,close=False):重绘环境的一帧。默认模式一般比较友好,如弹出一个窗口