利用流行偏见的因果干预建议

问题：流行偏差问题
在数据上，项目在交互频率上呈现不均匀分布
在方法上，协同过滤方法容易通过过度推荐热门项目来放大偏见

如何利用流行偏差来提高推荐的准确性？
问题分解：
（1）如何去除训练时受欢迎度偏差的不良影响？
（2）如何在生成top-𝐾推荐的推理阶段注入期望的受欢迎度偏差

1.用因果图分析了受欢迎度偏差对推荐系统的影响

2.新框架：流行偏差消除和调整(PDA)
该框架通过演算进行去中心化训练，并在推荐推理过程中对人气偏差进行因果干预。

因果图分析

传统因果图：

传统方法主要执行用户-项目匹配来预测相似性数:
𝑈🠀(用户节点)和𝐼🠀(项目节点)是原因，𝐶🠀是表示交互概率的结果节点。
例如：流行的潜在因素模型将预测形成为用户嵌入和项目嵌入之间的内积。
因为模型如何形成预测暗示了它如何假设标记数据被生成，这个因果图也可以解释观察到的交互数据的假设生成过程。
项目流行度虽然对数据生成过程有重要影响，但这种粗粒度建模方法并没有明确考虑项目流行度。

目流行度如何影响过程？

节点𝑍表示项目受欢迎程度，它有两条边分别指向𝐶和𝐼。
第一， 𝑍→ 𝐶意味着物品受欢迎程度直接影响互动概率。
因为很多用户都有从众心理，从而倾向于跟随大多数人去消费流行的物品。
第二， 𝑍 → 𝐼意味着项目受欢迎程度会影响项目是否被曝光。
因为推荐系统通常会继承数据中的偏见，更频繁地曝光受欢迎的项目。
值得注意的是，我们发现𝑍是𝐼和𝐶的共同原因，是暴露项目和观察到的相互作用之间的混淆因素。
这意味着，项目流行度𝑍通过两个因果路径影响观察到的交互数据:

𝑍→ 𝐶
𝑍 → 𝐼 → 𝐶，
其中第二个路径包含偏差放大的不良影响
因为它增加了观察到的流行项目的交互，即使它们可能与用户兴趣不太匹配。

消除流行偏见对模特训练的不良影响，我们需要对𝐼推荐的项目进行干预，使其不受𝑍.流行的影响。

在实验中，这意味着我们需要改变曝光策略，使其不受物品流行的影响,然后重新收集数据，然而这对学术界研究人员来说是昂贵且不可能实现的。

由于因果科学的进步，我们可以在不进行介入实验的情况下用 do-calculation[35]获得同样的结果。

简而言之，我们将用户-项目匹配估计为𝑃 (𝐶|𝑑𝑜(𝑈， 𝐼))在训练期间切断了𝑍 →𝐼的路径，这不同于现有的混淆用户的推荐模型所估计的相关性𝑃 (𝐶|𝑈， 𝐼)

描述推荐过程的因果图：
U：用户
I：暴露物品
C：交互概率
Z：项目流行度

我们将 𝑍 确定为 𝐼 和C之间的混杂因素，并提出与 𝑃(𝐶|𝑑𝑜(𝑈 , 𝐼)) 的去混淆训练作为兴趣匹配。

训练后，𝑃(𝐶|𝑑𝑜(𝑈 , 𝐼)) 比𝑃(𝐶|𝑈 , 𝐼) 更准确地估计用户对项目的兴趣匹配，消除了𝐼和C之间的虚假相关性。

由于𝑍的混杂,在推理阶段，我们将排名分数推断为𝑃(𝐶|𝑑𝑜(𝑈 , 𝐼),𝑑𝑜(𝑍))，对项目进行干预

干预流行度 𝑍 与我们期望的偏差（例如，预测的流行度在测试阶段）。

定义

大写字母表示随机变量，小写字母表示特定值
斜体表示对应随机变量的样本空间，例如U
用𝑃(.)表示随机变量的概率分布
让 D 表示按顺序收集的历史数据
经过了T阶段：
D = {D1∪· · ·∪D𝑇 };
U = {𝑢1, . . . ,𝑢|U |}
I = {𝑖1, . . . ,𝑖|I |}
通过对历史数据的学习，推荐系统有望捕捉用户偏好，为下一阶段的𝑇 + 1做好服务.也就是说，它的目标是在 D𝑇 +1 上获得高推荐准确度。
物品𝑖在𝑡阶段上的当地受欢迎程度定义为:

其中𝐷𝑖𝑡表示观察到的项目交互的数量D𝑡的𝑖。

我们可以类似地根据一个项目在D 中的交互频率来定义它在𝑚𝑖的全球受欢迎程度，但我们认为本地受欢迎程度对系统的曝光机制和用户决策有较大的影响
因为系统通常会定期重新训练，最新的数据影响最大。

人气漂移。直观地说，项目受欢迎程度是动态变化的，随着时间的推移，这意味着流行偏见的影响也可能是动态的。
为了量化流行度漂移，我们定义了一个称为流行度漂移(DP)的度量来衡量两者之间的漂移

+++++++++++++++++++++++++++++++++++++++++++++++++++++
图中:
人气漂移在:(a)连续两个阶段𝐷𝑃(𝑡,𝑡+1)；
第一阶段和现阶段𝐷𝑃 (1,𝑡). 阶段。
首先，我们将𝑡的每个阶段表示为项目的概率分布:[𝑚𝑡|1|，. . . ,𝑚𝑡|T| ]，其中每个条目表示一个项目在阶段上的出现频率。
然后，我们使用詹森-香农散度(JSD) 来测量两个阶段之间的相似性:

𝑡和𝑠是两个阶段。
和 JSD 类似， DP 的范围是[0,𝑙𝑜𝑔(2)]
较高的值表示较大的人气漂移。
图 (a)显示了两个连续阶段的差压值，即𝐷𝑃 (𝑡,𝑡 +1)， 𝑡在三个真实数据集上从 1 迭代到 9。
我们可以看到，这三个数据集都明显存在流行度漂移，不同的数据集表现出不同程度的流行度漂移。
图 (b)显示了第一阶段和当前阶段的差压值，即𝐷𝑃 (1,𝑡)，衡量累积的人气漂移。
我们可以看到一个明显的增长趋势，表明时间间隔越长，数据呈现的流行度漂移越大。
这些结果表明，流行偏见及其影响也随着时间的推移而变化。未来阶段的流行偏向与过去阶段不同。如果我们将模型泛化的目标设定为追求下一阶段数据 (D𝑇 +1)^2 的高精度，那么一个可行的方法是预测流行趋势并将其注入到推荐中
+++++++++++++++++++++++++++++++++++++++++++++++++++++

无基础培训

目的：不受𝑍→ 𝐼.影响的模型
+++++++++++++++++++++++++++++++++++++++++++++++++++++
如果我们能够干预暴露机制，使其随机向用户暴露物品，那么收集到的交互数据就不受𝑍 → 𝐼的影响。
直接在上面训练传统模型就可以了。然而，这种解决方案的可行性和有效性较低:
首先，只有推荐者构建者可以干预曝光机制，其他任何人都可以但是无权这样做；
其次，即使对于可以干预曝光机制的推荐器构建者来说，他们也只能使用少量的随机流量，因为随机曝光对用户体验的伤害很大。小型统一数据的有效使用仍然是推荐研究中的一个开放问题
+++++++++++++++++++++++++++++++++++++++++++++++++++++
因果科学的进步为我们提供了一种无需进行干预实验就能实现干预的工具。
关键在于微积分。
在我们的上下文中，执行𝑑𝑜(𝐼)强制消除𝐼's 父节点的影响，实现我
们的目标。因此，我们将预测模型表述为𝑃(𝐶|𝑑𝑜(𝑈、 𝐼))，
而不是用传统方法估计的𝑃 (𝐶|𝑈、 𝐼)。
假设图 1(b)所示的因果图是𝐺，图 1(c)所示的介入因果图是𝐺。然后，在𝐺上执行微积分会导致:

其中𝑃𝐺′ (.)表示在𝐺’上评估的概率函数。
下面一步一步解释这个推导:
(1)是因为借壳准则[35]作为唯一的借壳路径𝐼←𝑍→𝐺𝐶已经被𝑑𝑜(𝑈,𝐼)封锁)；
(2)是因为贝叶斯定理；
(3)因为𝑈和𝐼独立， 𝑍在𝐺
(4)𝑃(𝐶|𝑈 , 𝐼, 𝑍) = 𝑃𝐺′(𝐶|𝑈 , 𝐼, 𝑍)因为因果机制，{𝑈 , 𝐼, 𝑍} → 𝐶切断时不改变𝑍 → 𝐼
因为 𝑍 在两个图上有相同的先验，𝑃(𝑍) = 𝑃𝐺′(𝑍)

接下来，我们考虑如何估计数据中𝑃(𝐶|𝑑𝑜(𝑈 , 𝐼))
先估计𝑃(𝐶|𝑈 , 𝐼, 𝑍)，然后估计∑𝑧 𝑃(𝐶|𝑈 , 𝐼, 𝑧)𝑃(𝑧)
第一步,估计𝑃 (𝐶|𝑈， 𝐼,𝑍).
该条件概率函数评估给定用户项目对𝑈= 𝑢、 𝐼 = 𝑖以及项目当前流行度为𝑍 = 𝑚𝑡i，用户将消费该项目的可能性有多大。

假设条件概率函数的参数为 θ，我们可以按照传统的推荐训练来学习 θ，例如，对历史数据D上的成对 BPR 目标函数进行优化；

其中𝑗表示𝑢的负样本， 𝜎(.)是 sigmoid函数。
使用了𝐿2 正则化，但为了简洁起见没有显示

框架结束，开始参数优化：
设计为任何可微模型、因子分解机器或神经网络。
但是这里我们主要考虑的是将用户项目匹配与项目流行度分离。
好处是双重的:
1)解耦使我们的框架可以扩展到任何关注用户-项目匹配的协同过滤模型；
2)解耦使得能够在推断阶段快速调整流行偏差，因为我们不需要重新评估整个模型。
为此，我们将其设计为:

𝑓θ(𝑢,𝑖)表示任何用户-项目匹配模型

我们在本作品中选择简单矩阵分解(MF)；

超参数𝛾是为了平滑物品人气，可以控制从众效果的强弱:

设定𝛾 = 0 表示没有影响，数值越大分配的影响越大。

𝐸𝐿𝑈′ (.)是指数线性单位激活函数的变体，可确保匹配分数的积极性:

这是为了确保概率函数的单调性，因为(𝑚𝑡i)𝛾总是正数。
最后，请注意一个人需要𝑖归一化𝑃θ(𝑐=1|𝑢,𝑖,𝑚𝑖𝑡)使其成为严格的概率函数，但是我们省略了它，因为它很耗时，并且不影响项目的排名。

第二步。估计 í𝑧𝑃(𝐶|𝑈、 𝐼,𝑧)𝑃 (𝑧). 现在我们继续估计𝑃(𝐶|𝑑𝑜(𝑈， 𝐼)).
由于𝑍的空间很大，所以对每个预测评估对其空间求和是不合适的。
幸运的是，我们可以执行以下缩减来消除总和:

其中𝐸(𝑍𝛾)表示𝑍𝛾的期望。
注意，一个变量的期望值是一个常数。
由于𝑃(𝐶|𝑑𝑜(𝑈、 𝐼))被用于为用户对项目进行排名，
所以𝐸(𝑍𝛾)的存在不会改变排名。
因此，我们可以用𝐸𝐿𝑈′(𝑓θ(𝑢,𝑖)来估计𝑃(𝐶|𝑑𝑜(𝑈,𝐼)).
总而言之，我们将历史交互数据与𝑃θ(𝑐=1|𝑢,𝑖,𝑚𝑖𝑡)进行拟合，并使用用户-项目匹配组件𝐸𝐿𝑈′ (𝑓θ(𝑢,𝑖))来进行去相关排名。
我们称这种方法为流行偏见去中心化。

调整推理中的流行偏差

由于𝑃(𝐶|𝑑𝑜(𝑈， 𝐼))，我们可以消除流行偏见的不良影响。
我们现在寻求更好地利用流行偏见，例如，。推广有潜力受欢迎的产品。假设目标受欢迎程度偏差是𝑧˜，我们想赋予推荐策略这种偏差。
为了实现这个目标，我们只需要做𝑍 = 𝑧˜的干预进行模型推断:

其中𝑚˜ 𝑖代表𝑧˜.的受欢迎程度。
这个介入概率直接等于条件概率，因为在因果图中𝑍 和𝐶之间没有后门路径。
由于这项工作的重点不是流行预测，我们采用一个简单的时间序列预测方法来设定𝑚˜ 𝑖

𝑇𝑖是最后阶段的人气值， 𝛼是预测未来时控制人气漂移强度的超参数。我们把这种方法命名为流行偏差消除和调整(PDA)。

图说明了 PDA 的工作流程，其中训练阶段优化等式(4)，
推理阶段可以调整流行度偏差如下:

𝛾˜ 表示用于模型推断的流行平滑超参数，它可以不同于训练中使用的参数。
这是考虑到流行偏见的力量可以漂移

方法的工作流程。蓝色箭头代表训练阶段，红色箭头
代表推理阶段
实际上，设置𝛾˜ = 𝛾可以达到预期的性能。

设置𝛾˜ = 0 会将该方法降级为仅使用兴趣匹配进行推荐的 PD。

考虑到适当停止模型训练的重要性， PDA 使用了基于调整后推荐的模型选择策略，这与 PD 的策略略有不同。

(1)是边际分布的定义；
(2)是因为贝叶斯定理；
(3)是因为根据因果图𝑈独立于𝑍；
(4)是因为贝叶斯定理,与𝑃(𝐶|𝑑𝑜(𝑈 , 𝐼)) = ∑ 𝑃(𝐶|𝑈 , 𝐼, 𝑧)𝑃(𝑧)相比，我们可以看到𝑃(𝐶|𝑈 , 𝐼) 有一个附项:𝑃(𝐼 |𝑍)，从根本上改变了推荐评分。
假设𝐼= 𝑖是一个受欢迎的项目， 𝑃 (𝐶|𝑈， 𝐼 = 𝑖,𝑍 = 𝑚𝑖𝑡)是一个大值，因为𝑚𝑖𝑡大，
这意味着该项对预测得分有很大的贡献。
由于曝光机制中的流行偏差， 𝑃 (𝐼 = 𝑖|𝑍 = 𝑚𝑡)也是一个很大的数值。将这两个项相乘，更大地扩大了𝑖的得分，这给了𝑖一个更高的分数。
结果，人气偏差被不当放大。这种比较进一步证明了𝑃(𝐶|𝑑𝑜(𝑈,𝐼)可靠地学习用户兴趣的合理性和必要性。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,732评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,496评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,264评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,807评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,806评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,675评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,029评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,683评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,704评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,666评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,773评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,413评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,016评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,204评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,083评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,503评论 2赞 343

利用流行偏见的因果干预建议

利用流行偏见的因果干预建议

因果图分析

定义

推荐的因果观

无基础培训

调整推理中的流行偏差

推荐阅读更多精彩内容