以下内容纯属个人见解,欢迎大家交流。
发布于2020 SIGIR
1 motivation
1.1 问题
从交互数据中学习用户和项目的信息表示对于协同过滤(CF)至关重要。目前的嵌入函数利用用户-项目关系来丰富表示,从单个用户-项目实例发展到整体交互图。然而,他们在很大程度上以统一的方式模拟关系,而忽略了用户采用这些物品的意图的多样性,这可能是为了消磨时间,为兴趣,或为其他家庭购物。这种对用户兴趣进行统一建模的方法很容易导致不理想的表示,无法对不同的关系进行建模,也无法理清表示中的用户意图。
1.2解决方法
在这项工作中,我们特别关注在用户意图的更细粒度上的用户-项目关系。因此,我们设计了一个新的模型,Disentangled Graph Collaborative Filtering(DGCF),以解纠缠这些因素并得到解纠缠表示。具体来说,通过为每个用户-物品交互的意图分布建模,我们迭代地改进了意图感知交互图和表示。同时,我们鼓励不同意图的独立。这将导致分离的表示,有效地提取与每个意图相关的信息。
2 相关介绍
个性化推荐在现实世界的应用程序中越来越普遍,以帮助用户发现感兴趣的项目。因此,准确捕捉用户偏好的能力是核心。协同过滤(CF)是一种有效的解决方案,它关注用户与物品的历史交互(如购买、点击),假设行为相似的用户可能对物品有相似的偏好。对基于cf的推荐进行了广泛的研究,并取得了很大的成功。
尽管具有有效性,我们认为先前建模用户-物品关系的方式不足以发现不纠缠的用户意图。关键原因是现有的嵌入函数无法区分用户对不同商品的意图——它们要么将用户-商品交互视为一个孤立的数据实例,要么统一组织为交互图中的一条边(如图1左侧所示)来训练神经网络。一个潜在的事实被忽略了:用户通常有多个意图采用某些项目;此外,不同的意图可以激发不同的用户行为。以图1右侧为例,用户u观看电影i1是为了消磨时间,而不太关心i1的属性(如导演)是否与自己的兴趣相匹配;另一方面,u与i2的互动可能主要是由她对其导演的特殊兴趣所驱动。不考虑这一事实,之前的用户-物品关系建模是粗粒度的,这有几个局限性:1)不考虑实际用户意图很容易导致次优表示;2)由于嘈杂行为(如随机点击)通常存在于用户的交互历史中,混淆用户的意图会降低嘈杂交互的鲁棒性;3)用户意图将在表示中变得模糊和高度纠缠,这导致了较差的可解释性。
在认识到用户-物品关系的重要作用和之前嵌入函数的局限性之后,我们将重点放在用户意图的更细粒度层面上探索这些关系,以解开表示中的这些因素。从直觉上看,有多种意图会影响用户的行为,比如消磨时间、兴趣匹配或为家人等其他人购物。我们需要了解每个用户行为的用户意图分布情况,总结每个意图的可信度是用户采用某项内容的原因。联合分析所有历史交互的这种分布,我们可以得到一组意图感知交互图,进一步提取用户意图信号。然而,由于以下挑战,这并不是微不足道的:
•如何在表述中明确地呈现与每个意图相关的信号尚不清楚,也仍未探索;
•意图之间的独立性影响了解纠缠的质量,这需要量身定制的建模。
我们认为这种统一的用户-物品关系建模不足以反映用户的潜在意图。这限制了CF表示的可解释性和理解。更具体地说,目前的嵌入函数在关系(如交互图G)和输出表示上很大程度上采用了黑盒神经网络。他们无法通过假设行为背后的统一动机来区分用户对不同物品的意图。然而,这违背了用户在购买道具时通常有多种意图的事实。例如,用户u与i1和i2进行交互,目的分别是为了消磨时间和匹配个人品味。然而,这种潜在意图的挖掘较少,容易导致表征能力次优。
如果没有这样的用户意图建模,现有的作品很难提供可解释的嵌入,以便理解语义或在特定维度中编码了什么信息。具体来说,每一种相互作用(u,i)对各维度的贡献是不可区分的。结果,每个行为背后的潜在意图在嵌入中高度纠缠,模糊了意图和特定维度之间的映射。