4e293577acb1 - 简书

发简信

4e293577acb1

32
关注
1
粉丝
0
文章
0

字数
0

收获喜欢
60

总资产

IP属地：北京

winddy_akoky

Actor Critic
一、介绍 Actor-Critic 算法有两部分组成：actor 和 critic。其中 action 就是Policy Gradient 算法，critic 是Q-lear...

17932 2 4
文哥的学习日记

残差网络ResNet网络原理及实现
论文地址：https://arxiv.org/pdf/1512.03385.pdf 1、引言-深度网络的退化问题在深度神经网络训练中，从经验来看，随着网络深度的增加，模型理...

34531 1 19
文哥的学习日记

强化学习AC、A2C、A3C算法原理与实现！
跟着李宏毅老师的视频，复习了下AC算法，新学习了下A2C算法和A3C算法，本文就跟大家一起分享下这三个算法的原理及tensorflow的简单实现。视频地址：https://...

43977 0 34
文哥的学习日记

Q-Learning 和 SARSA 算法对比
1、Q-learning Q-learning算法的过程可以根据下面的步骤：首先，我们会初始化一个Q-table，可以是全0或者是其他的数值，一般都是全0，然后我们设定训练...

12811 0 12
臻甄

迷雾探险6 | Q-learning和Sarsa的区别理解
了解了强化学习各种算法及其分类关系后，就可以开始逐个击破和提升，在这里，我主要参考B站上莫烦大神的视频课程学习，并记录下自己的一些浅显的理解。详细文档可以直接移步莫大神的社区...

3586 0 3
MapleLuv

RCNN->SppNET->Fast-RCNN->Faster-RCNN
参考：RCNN介绍参考：RCNN,Fast RCNN, Faster RCNN整理总结一、 RCNN【借助CNN良好的特征提取和分类性能，通过RegionProposal方...

1006 1 10