240 发简信
IP属地:天津
  • 120
    Reinforcement Learning 重要性采样和Prioritized Experience Replay

    今天详细阅读了Prioritized Experience Replay这篇论文,记录下心得体会。 Introduction online RL目前面临的2个问题: stro...

  • 120
    论文阅读:Graph Convolutional Reinforcement Learning

    这篇论文主要介绍了DGN的算法,在DQN的基础上加了图网络,用于状态的融合。在多智能体环境下运用。relation kernel用的是self-attention。 这篇论文...

  • 稀疏矩阵的4种存储方式

    COO[https://www.geeksforgeeks.org/sparse-matrix-representation/]CSR[https://www.geeksfo...

  • 120
    GCN在推荐系统中的应用之GraphSage-based

    GraphSage GraphSage是在论文Inductive Representation Learning on Large GraphsWilliam中提出的一种归纳...

  • 120
    GCN在推荐系统中的应用

    图网络(graph neural network, GNN) Category: Recurrent Graph Neural Networks(RecGNNs) Convo...

  • 为什么在分类问题中常用交叉熵而不是MSE或者平均误差?

    交叉熵可以在得到正确结果的同时衡量模型的好坏; 交叉熵在模型不能很好拟合的似乎求的偏导大,而模型拟合的差不多之后偏导变小。对比之下,MSE在训练一开始就偏导趋近于0,不好训练...

  • 2020-12-07读论文:A Heterogeneous Graph Neural Model for Cold-start Recommendation

    这篇文章的主要贡献点在于通过user-item interactions建立interactive graph,通过social network建立social links,...

  • 120
    2020-12-03 - 2020-12-06 京东RL论文整理

    把京东系的强化学习的论文复习整理一下。 读论文:Recommendations with Negative Feedback via Pairwise Deep Reinfo...

  • 120
    2020-12-02学习笔记

    读论文:Reinforcement Learning to Rank in E-Commerce Search Engine: Formalization, Analysis...

  • 2020-11-26学习笔记

    24号所看论文知识点的学习 1. PCA降维 论文里的PCA降维主要是用来在构建平衡树的时候使用。因为在构建平衡树的时候需要先将相似的item放在一个节点上,效率才更高,所以...

  • 2020-11-24学习笔记

    阅读论文:Large-scale Interactive Recommendation with Tree-structured Policy Gradient 论文内容:模...