因果推断推荐系统工具箱 - Bias and Debias in Recommender System: A Survey and Future Directions（四）

文章名称

Bias and Debias in Recommender System: A Survey and Future Directions

核心要点

上一节中，我们讲述一下现有的方法是如何解决selecton bias的评估的，下面我们介绍一下如何在具有selection bias的数据上进行模型的训练。

方法细节

问题引入

Selection bias的问题在于用户可以自主的选择给哪些物品打分，并放弃掉其他物品的评分，造成数据确实并不是随机的。

具体做法

插值方法

解决数据缺失问题，比较简单直接的方法是进行插值。很多现有的方法，利用启发式的方式，同时建模物品的评分估计和物品打分是否会缺失。背后的原理是，用户是否给某个物品打分和用户对该物品的评分是强相关的。因此，通过同时推断用户是否会给物品打分以及实际的评分结果，实际上是在更好的建模观察（训练）数据的产生过程（DGP）。比如[1]把评分缺失的概率建模为混合多项式分布，[2]把缺失概率建模成逻辑回归模型，[3]，[2]建模为矩阵分解，[4]考虑的更深远，认为数据缺失受到了用户社交网络的影响。
但是由于直接建模整个机制会比较复杂，[5], [6]在缺失数据上直接插入一个特殊的值 $r_0$ ，并优化如下图所示的loss function，其中 $r_{u, i}^{o, i}$ 表示观测到的评分或者（给出的）插值，而 $W_{u, i}$ 表示样本权重，来控制插值数据对模型的影响。但是这种降权做到极端，就是让数据回归到缺失的情况，是需要很多经验调节的，感觉是在平衡噪声和偏差。同时，插值本身也需要很好的业务理解，不然错误或不准确的插值，会造成额外的误差，导致模型效果变差。

simple imputation

propensity score

因此，[7]提出了直接优化propensity score的评估准则，其中 $P_{u, i}$ 是user-item对被观测到评分的概率（本质上是也是一种建模是评分否会缺失的方法，只不过不是启发式的，而是利用propensity score的模型）。

propensity score training loss

Doubly Robust

但是如前所述，propensity score方法非常依赖propensity score模型的假设正确程度以及预估准确度。实际上，有了propensity score很自然的会想到用DR的方法。[8] 提出利用imputation error和propensity score error构造损失，来达到DR的效果。其中 $\hat{e}_{u, i} = \delta(r_0, \hat{r}_{u, i})$ 是估计评分和评分插值之间的差距，而 $o_{u, i}$ 是观测到user-item对的概率， $d_{u, i} = \delta(r_0, \hat{r}_{u, i}) - \delta(r, \hat{r}_{u, i})$ 衡量的是预估误差和差值误差的偏离程度，具体证明细节参见[8]。

imputation error and propensity error DR

Meta Learning

虽然DR方法能够缓解propensity score方法的问题，但是仍然存在由于propensity或者imputation模型不准确而导致的预估不准确的问题。因此，[3]提出了一种基于元学习的方法（这个元学习和causal inference里的meta learner以及迁移学习中的meta learning都不一样），这里的元学习更像meta-learner。首先通过两个基础模型A1, A2从有selection bias的数据中学习如何构造pseudo ratings（感觉思路上类似imputation，只是利用了不同的数据构造方法，并且有理论保证）。在pseudo ratings的基础上，训练模型A0来模拟无偏数据上训练的模型，理论证明模型优化的是无偏模型的一个上届，细节参见[3]。然而，这种方法非常依赖A2模型的准确度，A2的偏差会被引入到最终训练的模型中。尽管如此，文章的作者仍然认为这种具有理论保证单meta learning的方法是值得继续探索。

心得体会

imputation method

如前所述，数据差值的建模方式往往是同时建模评分预估和评分缺失的机制，以此建模整个数据产生的过程，即DGP。类似的想到了推荐模型当中同时建模CTR和CVR的模型，同时为两个目标，联合训练两个模型，促进了两个指标的估计，充分的利用了数据，其实也有一些偏差消除的感觉在里面。

propensity score and heuristic missing modeling

其实propensity score的方法和imputation中建模评分缺失机制的方法是类似的。至少估计的都是评分缺失的某种概率。区别仅仅在于如何利用这个概率，如果是构建IPS这种损失函数。那么就是propensity score方法。

文章引用

[1] B. M. Marlin, R. S. Zemel, S. Roweis, and M. Slaney, “Collaborative filtering and the missing at random assumption,” in UAI, 2007, pp. 267–275.
[2] B. M. Marlin and R. S. Zemel, “Collaborative prediction and ranking with non-random missing data,” in RecSys, 2009, pp. 5–12.
[3] J. M. Hernandez-Lobato, N. Houlsby, and Z. Ghahramani, “Probabilistic matrix factorization with non-random missing data.” in ICML, 2014, pp. 1512–1520.
[4] J. Chen, C. Wang, M. Ester, Q. Shi, Y. Feng, and C. Chen, “Social recommendation with missing not at random data,” in ICDM. IEEE, 2018, pp. 29–38.
[5] H. Steck, “Evaluation of recommendations: rating-prediction and ranking,” in RecSys, 2013, pp. 213–220.
[6] H. Steck, “Training and testing of recommender systems on data missing not at random,” in KDD, 2010, pp. 713–722.
[7] T. Schnabel, A. Swaminathan, A. Singh, N. Chandak, and T. Joachims, “Recommendations as treatments: Debiasing learning and evaluation,” in ICML, ser. JMLR Workshop and Conference Proceedings, vol. 48, 2016, pp. 1670–1679.
[8] X. Wang, R. Zhang, Y. Sun, and J. Qi, “Doubly robust joint learning for recommendation on data missing not at random,” in ICML, 2019, pp. 6638–6647.

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,732评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,496评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,264评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,807评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,806评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,675评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,029评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,683评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,704评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,666评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,773评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,413评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,016评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,204评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,083评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,503评论 2赞 343