2020-03-04 基本无害的计量经济学阅读笔记

学习计量经济学的历史应该是一部血泪史。

最开始的时候是本科大三上的时候，学习最基本的内容，学习Eviews，老师好像只讲到异方差。那时候上课还算认真，有段时间因为去日本访学，还在图书馆里看录的视频，看不懂就反复看。成绩应该还不错。有意思的是，老师讲到一个例子，好像是通货膨胀是否促进了经济增长，老师跑了个回归，说是正向促进作用。我觉得很奇怪的，这不一定是通货膨胀促进经济增长啊，还可能是经济增长导致通货膨胀啊。问了老师问题，老师糊弄我一下，就不了了之了。没想到的是，这个问题居然其实是计量经济学里最重要的问题。可想而知，老师已经脱离学术圈很久了。

大四的时候自学伍德里奇的计量经济学导论，学到一半就放弃了，Stata倒是学得很溜。那段时间也学习了很多杂的计量经济学知识，双重差分什么都是那个时候学的。所以那个时候觉得自己很厉害，我记得好像还买了陈强老师的书。

到了研究生阶段，上了中级和高级计量经济学，但老师以讲授理论知识为主，应用那部分自己也会了，其实对我的提升是非常有限的，基本没啥长进。也有选修专门的应用计量，貌似学到了一些东西，但自己写论文的过程中应用不多。

所以总觉得自己的大脑里没有形成体系，比如稳健的标准误，聚类是啥其实搞不明白。理论学得比较杂，应用也没有成体系，于是想着利用因为疫情呆在家的这段时间，看看这本书《基本无害的计量经济学》，英文名是Mostly Harmless Econometrics: An Empiricist's Companion。看看自己能不能坚持下去吧。

导论

1 关于“问题”的问题

一项研究的四个常见问题：

研究对象之间的关系，对象之间的因果关系是什么？
理想条件下的实验
识别策略，研究人员运用观察数据逼近真实实验的方式
推断模式，描述被研究的总体、所使用的样本以及构建标准误时所做的假设

书中收录的这首俳句很有意思：

T-stat looks too good.
Use robust standard errors-
significance gone.

2 理想的实验

2.1 选择性偏误

医院能够使人变得健康吗？如果比较去过医院的人和没去医院的人的健康问题，可以得到结论，没去过医院的人更加健康。所以去医院会变得不健康吗？当然也是有可能的，因为去医院可能会面临更高的传染病风险。

因为去医院的人一般是身体比较差的人，所以上面的说法肯定是存在问题的。也就是样本选择偏差。我们要考虑的是，本来要去医院的人，如果后来没去医院的话，他的身体会怎么样。

随机分配可以消除选择性偏误。

如果是随机分配的，其实加入控制变量是没有必要的，但是，一般来说，这种做法可以为我们带来对因果关系更加精确的估计。标准误可能会减小，估计更加显著。

第二部分核心

3 让回归变得有意义

Angrist曾经问Alen Meltzer，他是否对把时间花费在寻求回归结果上感到满意，因为那之后只不过是很多双面加宽绿色条的论文而已。他大笑，然后说这是他最愿意做的。现在Angrist们也和大学和研究院的老师和指导老师一样，整日地追寻着回归结果。

3.1 回归的基本原理

在没有随机分配可以利用时，我们未必能对回归结果赋予一个因果解释。

3.1.1 经济学中的关系和期望条件函数

即便无法解决因果性的难题，我们也很显然地知道在侠义地统计意义上，教育水平能够预测收入。我们使用条件期望函数（conditional expectation function, CDF）来概括和总结这种预测能力。

条件期望函数的分解性质：
任意一个随机变量Y都可以分解成由X解释的部分和正交于X的部分。

3.1.2 线性回归与条件期望函数

我们将经验研究看作在无需精确计算变量之间关系的同时捕捉到变量间统计关系实质的一种努力。

3.1.3 渐进最小二乘推断

一般而言，异方差实际不会带来太大的影响。在运用分组数据进行的回归中，如果分组样本的大小不同

3.1.4 饱和模型、主效应和其他有关的回归的话

饱和回归模型指的是具有离散解释变量的模型，对解释变量的所以可能取值，该模型都存在相应的参数与之想对应。

包括虚拟变量和二者乘积的回归中，虚拟变量的系数就叫做主效应（main effect），两个虚拟变量乘积叫做交互项。

3.2 回归于因果关系

3.2.1 条件独立假设

如果对于给定的总体，条件期望函数刻画了平均潜在结果之间的不同，那么就说这个条件期望函数具有因果性。

越来越觉得这像是一本哲学书。

Robert Frost's celebrated The Road Not Taken: the traveller-narrator sees himself looking back on an moment of choice. He believes that the decision to follow the roads less traveled "has made all the difference", though he also recognizes that counterfactual outcomes are unknowable.

条件独立假设指的是给定观察到的特点X，选择性偏误消失。

3.2.2 遗漏变量偏误公式

Omitted variable bias公式描述是当回归包含不同的控制变量时，回归结果之间存在的关系。这个公式的出发点是：可以对存在控制变量的回归方程赋予一个因果解释，但无法对不含有控制变量的回归方程赋予一个因果解释。因此，在不含控制变量的较短回归方程中得到的系数就被认为是biased。

短回归参数等于长回归参数加上一个数，这个数等于遗漏变量效应乘以遗漏变量对被包含变量的回归系数。

遗漏变量公式和解构回归公式都告诉我们当遗漏变量和纳入回归方程的变量不相关时，长回归和短回归得到的系数时一样的。

教育年限和工资收入的回归中，如果假如一些能力的变量，教育年限的系数机制减小了。

要说明条件独立假设时成立的，等于要说明控制了所有可观察的因素之后，服役和未服役的人之间是可比的。

3.2.3 不合格的控制变量

我们已经指出，对协变量的控制可以提高回归估计值获得因果解释的可能性，但并不是控制变量越多越好。有些控制变量是不合格的控制变量，将其加入回归固然可以改变回归系数，但实际上缺不该将其加入。

不合格的控制变量是那些可以作为实验结果的变量。不合格的控制变量本身可市作为被解释变量。合格的控制变量是指当我们选定回归元之后，它的取值已经固定给出的那些变量。

在一个经验研究中的例子中，我们可以看到将职业的虚拟变量加入回归后，确实降低了教育水平的系数。但我们很难解释是何种原因导致了这种下降。教育水平的系数变小可能仅仅是选择偏误的一种表现。因此我们最好还是用不由教育水平决定的那些变量作为控制变量。

当使用代理变量做控制变量时，也会出现不合格的控制变量问题，也就是说纳入回归方程的变量可能部分地控制遗漏变量，但是它本身被我们感兴趣地变量影响。
用代理变量作为控制变量得到的估计系数比没有控制的情况下更接近真实值。

当我们开始思考使用何种变量作为控制变量时，对不合格控制变量和代理性控制变量都适用一个挑选准则：考虑控制变量被决定地时间。一般来说，在我们感兴趣地变量产生之前就被决定的变量都是好的控制变量。如果时间不确定的话，因果关系的准确考量需要我们做出哪个变量先被决定的假设，或者说没有任何一个控制变量是由我们感兴趣的变量所影响的。

3.3 异质性和非线性

如果条件期望函数具有因果性，那么回归结果可以逼近条件期望函数这一事实使得回归系数也具有了某种意义上的因果性。不过这种说法不够精确。

回归是一种匹配估计量，并且由其提供的计算匹配估计量的方法具有良好的性质。

3.3.1 回归与匹配

事实上，匹配法对由每个协变量的特定值所决定的个体计算处理组和控制组之间的平均差异，然后用加权平均的方式将这些平均因果效应汇总到一个总的因果效应中。

回归于匹配都是用了控制协变量的研究策略。可以将回归看在一种特殊的匹配估计量，因此从经验研究的角度看，两者的区别并不太重要。

使用匹配法对被处理者的处理效应进行估计时，对于由协变量的不同取值足和所决定的不同组别的个体而言，匹配法将最大权重赋予最可能被处理的那组的个抽屉的处理效应。相比之下，回归估计将最大权重赋予条件方差最大的那组个体的处理效应。

对回归与匹配的进一步讨论：有序处理和连续处理

3.3.2 用倾向评分控制协变量

倾向评分定理指的是：给定多元协变量构成的向量，如果潜在结果与处理状态独立，那么给定协变量向量的某个值函数，潜在结果与处理状态仍然相互独立，这里协变量向量的值函数被称为倾向得分。

类似于回归中的遗漏变量公式，倾向评分定理指出我们只要将影响处理概率的协变量控制好就好。但实际上，这个定理还能让我们走得更远，我们位以需要控制的协变量就是处理概率本身。

最后编辑于：2020.03.17 13:12:30

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,547评论 6赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,399评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,428评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,599评论 1赞 274
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,612评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,577评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,941评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,603评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,852评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,605评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,693评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,375评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,955评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,936评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,172评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,970评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,414评论 2赞 342