因果推断深度学习工具箱 - Reducing Selection Bias in Counterfactual Reasoning for Individual Treatment Effect...

(代码实现的坑待填...,日更太难了...)

文章名称

Reducing Selection Bias in Counterfactual Reasoning for Individual Treatment Effects Estimation

核心要点

文章仍然关注binary treatment情境下的CATE估计。作者通过AE结合利用Pearson Correlation Coefficient的正则化,鼓励模型对covariates进行分解,从而学习两组不同的变量,一组和outcome的treatment assignment相关(group A),另一组与selection bias和outcome prediction都相关(group BC),最终用group BC来同时平衡selection bias并预测outcome。

方法细节

问题引入

文章来自NeurIPS 2019 CausalML Workshop。相比于通过balancing with representation learning,其实很多时候,我们把一些只影响potential outcome估计的covariates也当做是confounder来做adjustment,导致在学习样本平衡的时候存在噪声,因果效应的估计能力变差。从因果图的角度我们可以把confounder分为3类,第一类是只影响treatment assignment的;第二类是confounder,不但印象treatment assignment,也影响outcome;第三类则只影响outcome,具体因果图,如下图所示。作者期望把第一类和第二、三类covariates区分开,从而减少第一类covariates对potential outcome预测带来的噪声(因为我们不关心是不是哪些虽然影响策略分配,但完全不影响outcome的特征,他们不会带来偏差)。这个因果分解的思路最先出现在引用文章[1]里(后面会讲,其实这个思路还不完整,后续会介绍更完善的covariates分解的相关文章),不同的是这篇文章把BC合并在了一起,并且使用了不同的正则化方法 -- Pearson Correlation Coefficient。


covariates de-correlation

具体做法

实际的网络结构如图所示。首先,通过一个AE,学习样本表示\Phi(x) = [A, BC],样本表示由两部分向量组成。随后,利用学到的BC传递给outcome预测网络,进行不同counterfactual的预测。不知道有没有同学有似曾相识的感觉。大概还是自监督学习还没有兴起的时候(约2018-19年),曾经流行用AE在大量的无标签样本上进行重构损失的训练,然后利用训练的得到的隐向量,也就是这里的\Phi(x),来辅助做downstream的无监督学习(表示学习)。这种类型无监督结合有监督的方法在NLP,CV都有使用,比如做文本分类。后来还延伸出了很多方法,诸如先做无监督主题模型,学到的主题向量做文本分类(扯远了,回到正题...)。本质是通过引入covariates de-correlation的辅助任务,来消除selection bias,只是这个辅助任务比其他的任务要聪明,因为不但纠正了偏差,同时减少了噪声,同时符合因果图的理念(后边会看到更精妙的,比如去掉无意间引入的collidor)。

Network Architecture,RSB-Net

然而,仅凭这样的网络,是不可能达到很好估计causal effect的效果的,不然不就没有causal什么事儿了... 回想,causal inference的两个主要问题,1)missing counterfactual;2)selection bias。这两个问题还是需要通过loss function来解决。方法的整体loss如下,其中,L_{recon}是无监督表示学习的重构损失;L_{pred}没啥好说的,是factual的估计损失(也就是观测数据预测的准不准);L_{IPM}是分布距离损失,用来度量不同treatment下covariates分布的差异性,这个在之前介绍BNN的那篇完章里有些(理论证明的坑还没有填上...,容证明再飞一会儿...);而L_{pcc}就是文章的核心要点Pearson Correlation Coefficient。
loss function

重构损失L_{recon},是标准的L_2损失,度量covariates的重构能力,保证AE能够充分学习(这里也许可以采用其他的AE,当然已经有用VAE做的了)。
预估损失L_{pred},是BNN中提到的加权L_2损失。
prediction loss

prediction weight

分布差异损失L_{IPM},也是BNN中的Integral Probability Metric Loss。

IPM loss

de-correlation损失函数L_{pcc},是利用两个不同向量组(A和BC)的皮尔逊相关系数作为损失函数,当这个损失达到最小的时候,两个向量组线性无关。其中,\Phi_{A}(X_{k})_{i}指的是向量\Phi_{A}(X_{k})中的第i个元素。\Phi_{A}(X_{k})是指第k个样本的隐向量表示,\overline{\Phi_{Ai}}是所有样本的平均,其他同理。

PCC loss

代码实现

文章伪代码参见下图(实际代码的坑后续再填...)。


pseudo code

心得体会

unsupervised assassinated supervised learning

文章用到的类似无监督辅助有监督学习的思路,来帮助更准确的估计potential outcome。本质是寻找了更多的内在信息或结构,来引导potential outcome不要走偏(消除selection bias)。这个和自监督中寻找相关性的思路很吻合,也许自监督与causal inference结合的方法已经在路上了。

linear independent

文章虽然通过PCC让两个向量组A和BC线性无关,但是在现实世界里covariates之间的非线性关系是存在的,也是神经网络的优势之一。所以,这种损失的de-correlation性能可能比较有限。

文章引用

[1] Negar Hassanpour and Russell Greiner. Counterfactual regression with importance sampling weights. In Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence, IJCAI-19, pages 5880–5887, 7 2019.
[2] Shalit, U., Johansson, F.D., & Sontag, D. (2017). Estimating individual treatment effect: generalization bounds and algorithms. ICML.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,830评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,992评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,875评论 0 331
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,837评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,734评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,091评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,550评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,217评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,368评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,298评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,350评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,027评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,623评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,706评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,940评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,349评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,936评论 2 341

推荐阅读更多精彩内容