基于图的推荐算法(6): Neural Graph Collaborative Filtering

前言

摘要

学习用户和物品表征是当前推荐系统的核心。从早期的矩阵分解到最近出现的基于深度学习的方法,现有的努力通过从描述用户(或项目)的预先存在的特征映射,如 ID 和属性,来获得用户(或项目)的嵌入。

这种方法的一个固有缺点是,在用户-项目交互中隐藏的协同信号(高阶关系)在嵌入过程中没有被编码。因此,最终的嵌入表征可能无法具有协同过滤效应。

本文提出将用户-项目交互二部图整合到嵌入过程中。提出了一个新的推荐框架神经图协同过滤(NGCF) ,它通过在用户/项目图结构上传播嵌入来利用该结构。实现了二部图中高阶连通性(high-order connectivity)的高效建模,显式地将协同信号融入嵌入学习过程中。

与本系列前几篇工作的出发点基本相似,从二部图出发,探究如何挖掘/利用高阶连通性/关联性,通过不同的模型设计和表征构建来实现这一目的

前言


一般来说,可学习 的CF 模型(基于模型的CF方法)有两个关键组成部分:

  • 嵌入,将用户和项目转换为向量化表示;
  • 交互建模,基于嵌入重构历史交互。

例如,矩阵分解模型直接嵌入用户/项目 ID 作为矢量,并用内积计算交互; NCF使用非线性神经网络来取代MF中计算交互的内积操作等等。

这些模型尽管很高效,但这些方法为CF不足以生成高质量的特征嵌入,主要原因是:嵌入模块缺少对关键协同信号(collaborative signal)的显式编码,隐式地反映用户间(物品间)行为相似性。
更具体地说,大多数现有的方法只使用描述性特征(如 ID 和属性)来构建嵌入,而没有考虑用户与项目的交互,而这些交互仅用于定义模型训练的目标函数。因此,当嵌入不足以反映CF时,方法必须依靠交互来弥补次优嵌入的不足。

本文基于交互图结构以自然的方式来编码交互信息,利用用户-物品交互中的高阶联通性。

high-order connectivity概念如上图所示,如长路径u_1 \leftarrow i_2 \leftarrow u_2 \leftarrow i_4表明用户u1可能会点击i4,同时与i5相比,i4更适合推荐给u1;因为<i4,u1>间有两条路径,而<i5,u1>间只有一条路径。

模型总体设计思路

  • 设计嵌入特征,并基于图神经网络的方式在图上迭代地传递嵌入;
  • 通过多层嵌入传递层堆叠来捕捉高阶联通性。

模型方法

1. Embedding Layer

用户和物品嵌入构成模型嵌入表:

2. Embedding Propagation Layer 嵌入传播

  • 1阶关系传播 First-order Propagation
    直接交互的物品(用户)能够最直接反映用户(物品)的特性,基于这种假设在相连的用户-物品对间进行嵌入传递,主要包括两个操作:

    • Message Construction:
      从i到u的边,不仅考虑了节点i的特征\mathbf{e}_i,还考虑了用户节点和物品节点的交互\mathbf{e}_i\odot \mathbf{e}_u,传统的GNN网络往往只会考虑邻接节点的特征\mathbf{e}_i来传递.
      这种设计的优势在于:使得计算出来的信息依赖于两个节点的亲和力(affinity),即会传递来自相似节点的更多信息。能够增强模型表征能力,同时提升模型效果。
      那么p_{ui}就是对应拉普拉斯正则,N_u,N_i表示用户和物品节点的一跳邻居数量。
    • Message Aggregation 消息聚合. 将当前节点的近邻消息进行整合,同时考虑自环的情况(self-connection)
  • 高阶关系传播:通过堆叠嵌入传播层,可以实现高阶关系的利用:

    u_1 \leftarrow i_2 \leftarrow u_2 \leftarrow i_4这样的长路径中的协同信号可以被上面的传播过程捕捉到。

  • 传播的矩阵形式表示:

3. 模型预测

将各层的用户/物品嵌入进行拼接得到最后的表征

4. 模型优化

此外采用了Message and Node Dropout,对传递的信息进行dropout;同时对节点进行随机block,丢弃其信息。
注意,dropout仅用于训练过程,并且必须在测试时取消。Message dropout使得表征对于用户和物品之间是否存在单个连接具有更强的鲁棒性,Node dropout则侧重于减少特定用户或项目的影响

实验结果

将NGCF与之前几类主流CF方法进行对比:1)MF-based

  1. Hop-Rec 将高阶关联融入MF的;

    3)GC-MC与Pinsage:当时基于图神经网络的SOTA方法

同时分析了NGCF中的消息传递方法的高效性:

小结

  • 本文是基于图神经网络对CF进行改进的算法比较成熟、完整的工作,模型思路简单明晰,同时具有针对性的设计。也是后续该方向发展的重要文献。

END

本人简书所有文章均为原创,欢迎转载,请注明文章出处 。百度和各类采集站皆不可信,搜索请谨慎鉴别。技术类文章一般都有时效性,本人习惯不定期对自己的博文进行修正和更新,因此请访问本人简书主页查看最新信息https://www.jianshu.com/u/40d14973d97c

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容