11
0
写了 56031 字,被 51 人关注,获得了 105 个喜欢
在2017年的时候,无论是openai或者是deepmind,在深度强化学习领域都取得了重大突破,而能带来这个突破的一个重要因素便是PPO(Proximal Policy O...
写了 207075 字,被 130458 人关注,获得了 1532 个喜欢
写了 0 字,被 10980 人关注,获得了 89 个喜欢
写了 0 字,被 11672 人关注,获得了 57 个喜欢
写了 0 字,被 11865 人关注,获得了 8 个喜欢
写了 0 字,被 13992 人关注,获得了 102 个喜欢
写了 889715 字,被 58293 人关注,获得了 11630 个喜欢
写了 10336209 字,被 198974 人关注,获得了 138672 个喜欢
写了 3832838 字,被 77982 人关注,获得了 14326 个喜欢
写了 2340869 字,被 184181 人关注,获得了 1853 个喜欢
写了 0 字,被 133753 人关注,获得了 0 个喜欢