今天详细阅读了Prioritized Experience Replay这篇论文,记录下心得体会。 Introduction online RL目前面临的2个问题: stro...
今天详细阅读了Prioritized Experience Replay这篇论文,记录下心得体会。 Introduction online RL目前面临的2个问题: stro...
这篇论文主要介绍了DGN的算法,在DQN的基础上加了图网络,用于状态的融合。在多智能体环境下运用。relation kernel用的是self-attention。 这篇论文...
COO[https://www.geeksforgeeks.org/sparse-matrix-representation/]CSR[https://www.geeksfo...
GraphSage GraphSage是在论文Inductive Representation Learning on Large GraphsWilliam中提出的一种归纳...
图网络(graph neural network, GNN) Category: Recurrent Graph Neural Networks(RecGNNs) Convo...
交叉熵可以在得到正确结果的同时衡量模型的好坏; 交叉熵在模型不能很好拟合的似乎求的偏导大,而模型拟合的差不多之后偏导变小。对比之下,MSE在训练一开始就偏导趋近于0,不好训练...
这篇文章的主要贡献点在于通过user-item interactions建立interactive graph,通过social network建立social links,...
把京东系的强化学习的论文复习整理一下。 读论文:Recommendations with Negative Feedback via Pairwise Deep Reinfo...
读论文:Reinforcement Learning to Rank in E-Commerce Search Engine: Formalization, Analysis...
24号所看论文知识点的学习 1. PCA降维 论文里的PCA降维主要是用来在构建平衡树的时候使用。因为在构建平衡树的时候需要先将相似的item放在一个节点上,效率才更高,所以...
阅读论文:Large-scale Interactive Recommendation with Tree-structured Policy Gradient 论文内容:模...