240 发简信
IP属地:青海
  • 120
    PPO算法解析

    在2017年的时候,无论是openai或者是deepmind,在深度强化学习领域都取得了重大突破,而能带来这个突破的一个重要因素便是PPO(Proximal Policy O...