Avatar notebook default
14篇文章 · 16495字 · 1人关注
  • Resize,w 360,h 240
    2021 重启强化学习(5) 多摇臂老虎机(UCB)

    如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和简书使用头像一致。 通过一...

  • Resize,w 360,h 240
    2021 重启强化学习(4) 多摇臂老虎机

    如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和简书使用头像一致。 我们继...

  • Resize,w 360,h 240
    2021 重启强化学习(3) 多摇臂老虎机

    如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和简书使用头像一致。 多摇臂...

  • Resize,w 360,h 240
    2021 重启强化学习(2)—马尔可夫决策过程

    如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和简书使用头像一致。 马尔可...

  • Resize,w 360,h 240
    2021 重启强化学习(1)

    如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和简书使用头像一致。 Dee...

  • 离散贝叶斯过滤器(1)

    离散贝叶斯过滤器 Kalman 滤波器属于贝叶斯滤波器家族一个成员。大多数教科书上,都将 Kalman 滤波器看作 Bayesian 公式的一种...

  • Resize,w 360,h 240
    2021 重启强化学习(4) 马尔可夫决策过程(MDP)

    马尔可夫决策过程 马尔可夫决策过程(MDP) 可以通过马尔可夫决策过程来表示智能体和环境交互的整个过程 马尔可夫过程(Markov Proces...

  • Resize,w 360,h 240
    2021 重启强化学习(5) 马尔可夫决策过程和动态规划

    如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和简书使用头像一致。 在 M...

  • Resize,w 360,h 240
    强化学习随笔

    甜点 虽然早已经过了学习围棋的年龄,大学时候学校举办过各个系围棋联赛。随着参加工作,围棋渐渐被遗忘了。直到 AlphaGo 出现再次引起我对围棋...

文集作者