因果推断推荐系统工具箱 - 1BITMC

文章名称

【NIPS-2019】Missing Not at Random in Matrix Completion:The Effectiveness of Estimating Missingness Probabilities Under a Low Nuclear Norm Assumption

核心要点

文章旨在解决评分矩阵中的selection bias的问题,为了能够从理论上保证倾向性得分矩阵P估计的比较准确,作者提出利用1-bit matrix补全的方法[2]来倾向性得分矩阵P,并进一步估计优化一个nuclear norm运输下的IPS-MSE损失函数,得到对评分(用户偏好)的无偏估计结果(相对于selection bias而言)。

方法细节

问题引入

在推荐等场景中,由于存在各种偏差,如selection bias,导致评分或转化矩阵的数据缺失是非随机的。如果直接以这样的数据作为学习目标,可能导致模型的预测结果有偏。现有很多方法利用IPS进行模型纠偏(纠正数据偏差)。然而,这些方法采用的模型通常比较复杂,并且有较强的假设。

假设我们观测到的评分矩阵为X \in (R \cup {\star})^{m \times n},其中\star表示缺失。由于数据的缺失并非随机的,因此如果我们能够很好的估计(展示)观测概率矩阵P \in [0, 1]^{m \times n}(也就是所谓的propensity score 矩阵),可以比较好的消除MNAR矩阵不全方法的偏差。因此,作者专注于估计倾向得分矩阵P,并研究P的误差是如何影响下游矩阵完成的准确性的。

作者通过观察发现,倾向性得分构成的矩阵,通常具有低核范数的性质。即便只观测到部分数据,只要转化或评分矩阵有足够的行、列存在观测到的数据,就可以对倾向性得分矩阵进行还原。两个常用数据集的结果如下图所示,两个图的左侧为原始数据集的缺失分布(深色为缺失),右侧为利用谱双聚类[1]进行换算后的结果(行列按照这个方法的结果重新调换了)。可以看到明显的块结构。由于P具有这种低核范数(具有低秩或者行列聚簇结构)的性质,作者表示,可以从观测到的数据缺失矩阵M \in \{0 , 1\} ^{m \times n},M_{u, i} = \mathbb{1} \{ X_{u, i} \neq \star\}(其中1表示该用户-物品元组的评分缺失)中还原propensity socre矩阵P

missing matrix with low nuclear norm

作者使用1-bit矩阵补全算法[2],从缺失矩阵M中还原倾向得分矩阵P。该算法求解核范数约束下的最大似然估计的凸优化问题,虽然原算法是用来进行矩阵补全的,但是作者利用这个算法对全知矩阵M进行去噪声,以此还原倾向得分矩阵\hat{P}。进而利用\hat{P}来对MNAR的评分矩阵X进行偏差纠正。

具体做法

如上所述,X \in (\mathbb{R} \cup {\star})^{m \times n},是有缺失的,观测评分矩阵。我们定义X^* \in (\mathbb{R})^{m \times n}是没有缺失的评分矩阵,但是X = S + W是有噪声的,噪声为W(这个噪声代表了一些其他的偏差),而S表示用户的真实偏好。矩阵补全算法的目的通过一些结果方面的假设(假设包括low nuclear norm,low rank,a latent model等),来正确的估计S矩阵中元素的值。

如果我们能够得到矩阵X^*(我们全知,oracle),那么我们可以通过最小化损失的方式求得在MSE下的估计值\hat{S}。MSE的估计方法如下图所示。

MSE loss

然而,通常我们只能得到观测矩阵X,因此只能使用通过经验风险最小化的方式来优化基于观测数据的MSE损失,对S进行估计,估计方式如下图所示。

ERM MSE loss

倾向性得分矩阵P表示了X^*X的数据缺失过程,其中的各个元素是独立的,但取值可能不相同的,表示了selection bias是独立不同的。如果这些元素的取值是相同的,基于观测的经验风险最小化L_{MSE}得到的估计值,将是对整体L_{Full MSE}优化得到的估计值的一个无偏估计量。然而,当P中各元素是独立的独立时,估计的结果将是有偏差的。我们可以利用IPS的方法,从基于因果推断的角度对观测估计量进行纠正,该方法可以被证明无偏的,估计方法如下图所示。

IPS MSE loss

任何优化MSE loss的方法都可以被转换为IPS纠正后的,用于优化IPS-MSE损失的方法。结合1)IPS-MSE;2)nuclear norm正则下的MSE,我们可以得到如下图所示的损失函数,其中\|\cdot\|_{*}。表示nuclear norm,\Gamma表示评分或者用户偏好矩阵。

IPS & nuclear norm regularized MSE

然而,IPS方法始终需要我们知道P。如上所述,我们利用[2]提出的带nuclear norm约束的最大似然估计方法,从矩阵M(如上所述的确实矩阵)中还原P。具体方法是,定义P_{u, i} = \sigma(A_{u,i}),其中\sigma是sigmoid函数(当然我们可以指定其他的函数),A_{u,i}是参数据矩阵,满足如下图所示的核范数和最大范数约束。

parameter matrix A

整个模型参数求解过程可以被形式化为,1)利用约束的最大似然估计(如下图所示),得到参数矩阵的估计值\hat{A}(作者提到如果是logistic函数,可以利用投影梯度下降进行凸优化求解);2)\hat{P}_{u, i} = \sigma(\hat{A}_{u,i})

estimate parameter matrix A

到这里模型的大致思路和构建方法、求解方法就讲完了,关于 1-bit matrix completion 的方法,细节请参见[2]。本文的实际亮点是这样的做法能够从理论上保证\hat{P}估计的比较好,这里偷个懒,有时间在追加一下理论证明的过程。

心得体会

噪声W

个人认为,propensity score矩阵P中的每一个概率代表了selection bias,而系统中往往还存在其他偏差。例如,曝光偏差,流行度偏差等等,可用噪声矩阵W来代表。当然,这里要看我们有没有把S里的数据看作是随机变量,如果不是,那么W还代表了偏好随机变量的随机性。

SNIPS

文中作者提到,虽然SNIPS的归一化常数可以被融入到正则项的超参数\lambda中,但是利用SNIPS可以减少结果的不稳定性(对曝光样本数量的敏感度),以及提升模型的效果。因此,作者仍然采用SNIPS而不是IPS来进行模型的优化求解。其实,任何场景都可以优先考虑使用SNIPS,实际效果会好比较多。

数据特性局限性?

不得不说,这个方法还是有数据特性限制的,如果数据不存在明显的low nuclear norm的特点,也无法顺利使用该方法。

©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容