文章名称
Doubly robust joint learning for recommendation on data missing not at random
核心要点
上一节主要讲了问题MNAR的问题,以及EIB和IPS等方法如何进行纠偏。这一节我们来看作者是如何做DR的。
方法细节
问题引入
具体做法
Error-imputation-based
Error-imputation-based的方法采用启发式的插值方式,构造真实评分估计误差的无偏估计量,来替换直接利用观测数据进行评分估计。其中,是通过超参数和结合模型的估计评分得到的。通过类似因果推断binary treatment下,利用potential outcome构造factual outcome的式子,得到最终的估计误差项。
其中,如下图所示,被称为误差偏离,用来衡量真实评分误差和插值评分误差的偏离程度。这个误差项在本文中被用来进行联合训练。
Inverse-propensity-scoring
IPS的方法是因果推断中比较常见的。利用估计的user-item对被观测到的可能性,对样本进行逆概率调权,最终得到对真实评分估计的无偏估计量。
为了减小IPS的方差,也可以采用类似offline policy evaluation的self-normalization IPS减小方差。
心得体会
A Causal View
如上边提到,EIB其实是类似binary treamtent下的causal inference问题的某种构造损失。除此之外,其实EIB的有点类似于balancing,只不过这里的是常数。同时,还利用进行了平移。也就是说,无论是EIB还是IPS都是可以从因果角度解释的,可见Debias这件事情无论在哪个场景都有因果的痕迹。其实,直接在观测数据集上估计评分,类似于因果推断的Directly Prediction方法,后边又有了PSM(也就是matching和balancing)以及IPS。