笔记-倾向评分定理

去年10月份一篇读书笔记,当时看的是《基本无害的计量经济学》

对于协变量(独立变量,实验者不能操作,但是仍影响实验结果),作者引入倾向评分来控制协变量。

PSM

倾向评分定理指出我们只要将影响处理概率的协变量控制住就好。下面以一个例子来再阐述下~

例子:分析读研究生与否对小明同学的影响。

困难:小明已经读了研究生,怎么才能估计出他要是不读研究生,他的收入会是多少呢?

办法:引入“倾向得分匹配”,这种方法能让我们从一堆没有读研究生的人群中(即我们的总体样本的一个子集),对每个人读研究生的概率进行估计,然后选出和小明具有非常相似的去读研究生的概率,可是没有去读的小刚同学——作为小明的对照,然后再来看他们的区别。

步骤:

  1. 要对总体样本执行probit或者logit模型,然后估计出每一个观测对象读研究生的概率是多少。
    probit [dependent var] [independent var]
    其中,[dependent var]是一个0或1的二进制变量,1代表该对象读了研究生,否则是0。
  2. 对每一个观测值,我们根据估计出来的probit模型,算出他读研究生的概率是多少。
    predict pscore, p
    其中,pscore是定义的记录每个观测对象概率的变量名称。
  3. 使用psmatch2命令,让Stata帮你对于每个读了研究生的观测对象,找出一个与之具有最接近的概率值的,可是没有读研究生的观测对象
    psmatch2 [dependent var], pscore(pscore) noreplacement
    其中,(pscore)是在第二步中生成的那个记录对象概率的变量,noreplacement是一个选项,使得任何读了研究生的观察对象的对照对象都具有唯一性,换言之,只能1对1匹配。
  4. Stata会在你的数据中自动添加几个变量,其中_id是自动生成的每一个观测对象唯一的ID;_treated表示某个对象是否读了研究生,如果读了,_n表示的是他被匹配到的对照对象的_id;_pdif表示一组匹配了的观察对象他们概率值的差

倾向评分模型将我们的注意力从估计E[Yi|Xi,Di]转移到估计倾向评分p(Xi)=E[Di|Xi],在实际运用中后者更便于模型化。

但作者仍认为回归应该成为大部分经验研究项目的起点,尽管用倾向评分匹配我们提供了一个更加可靠的对平均处理效果的估计。因为在运用倾向评分方法进行匹配时有太多的细节需要考虑,比如如何模型化评分,如何进行推断,目前还没有形成一套标准,造成即使使用相同的数据和协变量,不同的研究者也可能得到不同的结果。

关于回归的细节,作者依次讨论了样本权重和被解释变量有限不连续。
对回归进行加权平均的一个简单经验就是当加权可使估计的数值更加接近总体的相应值时么就应该使用加权回归。比如,我们的被估计量是总体回归方程,但是用来估计的样本是非随机的,那么这时候用加权最小二乘法就很有道理。

很多经验研究中使用的被解释变量都只取有限的一些值。很多教科书说OLS适合于估计的被解释变量是连续变量的情形,当我们感兴趣的被解释变量取值有限时,线性回归模型就不合适,此时用类似于probit和tobit等非线性模型会更好。

但作者认为有限被解释变量带来的问题并不严重,因为回归的合法性来自它和条件期望函数之间的关系。在考虑边际效应时,线性模型和非线性模型下结论的差别很小。像奥拉姆剃刀原理所说“如无必要,勿增实体”。虽然计算边际效应很容易,但对于非线性模型还有很多问题要处理,特别是当我们在非线性模型中使用工具变量或者面板数据时,还会遇到更复杂的问题。

参考资料:

  1. 《基本无害的计量经济学》
  2. 倾向得分匹配(Propensity Score Matching) 的通俗解析及在Stata里的运用
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容

  • 混杂因素通常具备以下几个特点: *混杂因素必须与研究结局密切相关; * 混杂因素又与研究的暴露/处理因素有关;...
    飘乐云阅读 8,646评论 0 11
  • 多目标跟踪的问题是这样的:有一段视频,视频是由 N 个 连续帧构成的。从第一帧到最后一帧,里面有多个目标,不断地有...
    Fantesla阅读 6,419评论 0 9
  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 8,655评论 0 3
  • 转载自 https://mp.weixin.qq.com/s/OXXtPoBrCADbwxVyEbfbYg 25....
    _龙雀阅读 1,647评论 0 0
  • 上海的风跟饿虎似的,听着怪渗人的。前天刮了一整天的风,带下来几个小雨。出门一趟,脸上刮的生疼。昨天早上起来,发现外...
    灵芙醉客阅读 394评论 0 12