学习计量经济学的历史应该是一部血泪史。
最开始的时候是本科大三上的时候,学习最基本的内容,学习Eviews,老师好像只讲到异方差。那时候上课还算认真,有段时间因为去日本访学,还在图书馆里看录的视频,看不懂就反复看。成绩应该还不错。有意思的是,老师讲到一个例子,好像是通货膨胀是否促进了经济增长,老师跑了个回归,说是正向促进作用。我觉得很奇怪的,这不一定是通货膨胀促进经济增长啊,还可能是经济增长导致通货膨胀啊。问了老师问题,老师糊弄我一下,就不了了之了。没想到的是,这个问题居然其实是计量经济学里最重要的问题。可想而知,老师已经脱离学术圈很久了。
大四的时候自学伍德里奇的计量经济学导论,学到一半就放弃了,Stata倒是学得很溜。那段时间也学习了很多杂的计量经济学知识,双重差分什么都是那个时候学的。所以那个时候觉得自己很厉害,我记得好像还买了陈强老师的书。
到了研究生阶段,上了中级和高级计量经济学,但老师以讲授理论知识为主,应用那部分自己也会了,其实对我的提升是非常有限的,基本没啥长进。也有选修专门的应用计量,貌似学到了一些东西,但自己写论文的过程中应用不多。
所以总觉得自己的大脑里没有形成体系,比如稳健的标准误,聚类是啥其实搞不明白。理论学得比较杂,应用也没有成体系,于是想着利用因为疫情呆在家的这段时间,看看这本书《基本无害的计量经济学》,英文名是Mostly Harmless Econometrics: An Empiricist's Companion。看看自己能不能坚持下去吧。
导论
1 关于“问题”的问题
一项研究的四个常见问题:
- 研究对象之间的关系,对象之间的因果关系是什么?
- 理想条件下的实验
- 识别策略,研究人员运用观察数据逼近真实实验的方式
- 推断模式,描述被研究的总体、所使用的样本以及构建标准误时所做的假设
书中收录的这首俳句很有意思:
T-stat looks too good.
Use robust standard errors-
significance gone.
2 理想的实验
2.1 选择性偏误
医院能够使人变得健康吗?如果比较去过医院的人和没去医院的人的健康问题,可以得到结论,没去过医院的人更加健康。所以去医院会变得不健康吗?当然也是有可能的,因为去医院可能会面临更高的传染病风险。
因为去医院的人一般是身体比较差的人,所以上面的说法肯定是存在问题的。也就是样本选择偏差。我们要考虑的是,本来要去医院的人,如果后来没去医院的话,他的身体会怎么样。
随机分配可以消除选择性偏误。
如果是随机分配的,其实加入控制变量是没有必要的,但是,一般来说,这种做法可以为我们带来对因果关系更加精确的估计。标准误可能会减小,估计更加显著。
第二部分 核心
3 让回归变得有意义
Angrist曾经问Alen Meltzer,他是否对把时间花费在寻求回归结果上感到满意,因为那之后只不过是很多双面加宽绿色条的论文而已。他大笑,然后说这是他最愿意做的。现在Angrist们也和大学和研究院的老师和指导老师一样,整日地追寻着回归结果。
3.1 回归的基本原理
在没有随机分配可以利用时,我们未必能对回归结果赋予一个因果解释。
3.1.1 经济学中的关系和期望条件函数
即便无法解决因果性的难题,我们也很显然地知道在侠义地统计意义上,教育水平能够预测收入。我们使用条件期望函数(conditional expectation function, CDF)来概括和总结这种预测能力。
条件期望函数的分解性质:
任意一个随机变量Y都可以分解成由X解释的部分和正交于X的部分。
3.1.2 线性回归与条件期望函数
我们将经验研究看作在无需精确计算变量之间关系的同时捕捉到变量间统计关系实质的一种努力。
3.1.3 渐进最小二乘推断
一般而言,异方差实际不会带来太大的影响。在运用分组数据进行的回归中,如果分组样本的大小不同
3.1.4 饱和模型、主效应和其他有关的回归的话
饱和回归模型指的是具有离散解释变量的模型,对解释变量的所以可能取值,该模型都存在相应的参数与之想对应。
包括虚拟变量和二者乘积的回归中,虚拟变量的系数就叫做主效应(main effect),两个虚拟变量乘积叫做交互项。
3.2 回归于因果关系
3.2.1 条件独立假设
如果对于给定的总体,条件期望函数刻画了平均潜在结果之间的不同,那么就说这个条件期望函数具有因果性。
越来越觉得这像是一本哲学书。
Robert Frost's celebrated The Road Not Taken: the traveller-narrator sees himself looking back on an moment of choice. He believes that the decision to follow the roads less traveled "has made all the difference", though he also recognizes that counterfactual outcomes are unknowable.
条件独立假设指的是给定观察到的特点X,选择性偏误消失。
3.2.2 遗漏变量偏误公式
Omitted variable bias公式描述是当回归包含不同的控制变量时,回归结果之间存在的关系。这个公式的出发点是:可以对存在控制变量的回归方程赋予一个因果解释,但无法对不含有控制变量的回归方程赋予一个因果解释。因此,在不含控制变量的较短回归方程中得到的系数就被认为是biased。
短回归参数等于长回归参数加上一个数,这个数等于遗漏变量效应乘以遗漏变量对被包含变量的回归系数。
遗漏变量公式和解构回归公式都告诉我们当遗漏变量和纳入回归方程的变量不相关时,长回归和短回归得到的系数时一样的。
教育年限和工资收入的回归中,如果假如一些能力的变量,教育年限的系数机制减小了。
要说明条件独立假设时成立的,等于要说明控制了所有可观察的因素之后,服役和未服役的人之间是可比的。
3.2.3 不合格的控制变量
我们已经指出,对协变量的控制可以提高回归估计值获得因果解释的可能性,但并不是控制变量越多越好。有些控制变量是不合格的控制变量,将其加入回归固然可以改变回归系数,但实际上缺不该将其加入。
不合格的控制变量是那些可以作为实验结果的变量。不合格的控制变量本身可市作为被解释变量。合格的控制变量是指当我们选定回归元之后,它的取值已经固定给出的那些变量。
在一个经验研究中的例子中,我们可以看到将职业的虚拟变量加入回归后,确实降低了教育水平的系数。但我们很难解释是何种原因导致了这种下降。教育水平的系数变小可能仅仅是选择偏误的一种表现。因此我们最好还是用不由教育水平决定的那些变量作为控制变量。
当使用代理变量做控制变量时,也会出现不合格的控制变量问题,也就是说纳入回归方程的变量可能部分地控制遗漏变量,但是它本身被我们感兴趣地变量影响。
用代理变量作为控制变量得到的估计系数比没有控制的情况下更接近真实值。
当我们开始思考使用何种变量作为控制变量时,对不合格控制变量和代理性控制变量都适用一个挑选准则:考虑控制变量被决定地时间。一般来说,在我们感兴趣地变量产生之前就被决定的变量都是好的控制变量。如果时间不确定的话,因果关系的准确考量需要我们做出哪个变量先被决定的假设,或者说没有任何一个控制变量是由我们感兴趣的变量所影响的。
3.3 异质性和非线性
如果条件期望函数具有因果性,那么回归结果可以逼近条件期望函数这一事实使得回归系数也具有了某种意义上的因果性。不过这种说法不够精确。
回归是一种匹配估计量,并且由其提供的计算匹配估计量的方法具有良好的性质。
3.3.1 回归与匹配
事实上,匹配法对由每个协变量的特定值所决定的个体计算处理组和控制组之间的平均差异,然后用加权平均的方式将这些平均因果效应汇总到一个总的因果效应中。
回归于匹配都是用了控制协变量的研究策略。可以将回归看在一种特殊的匹配估计量,因此从经验研究的角度看,两者的区别并不太重要。
使用匹配法对被处理者的处理效应进行估计时,对于由协变量的不同取值足和所决定的不同组别的个体而言,匹配法将最大权重赋予最可能被处理的那组的个抽屉的处理效应。相比之下,回归估计将最大权重赋予条件方差最大的那组个体的处理效应。
对回归与匹配的进一步讨论:有序处理和连续处理
3.3.2 用倾向评分控制协变量
倾向评分定理指的是:给定多元协变量构成的向量,如果潜在结果与处理状态独立,那么给定协变量向量的某个值函数,潜在结果与处理状态仍然相互独立,这里协变量向量的值函数被称为倾向得分。
类似于回归中的遗漏变量公式,倾向评分定理指出我们只要将影响处理概率的协变量控制好就好。但实际上,这个定理还能让我们走得更远,我们位以需要控制的协变量就是处理概率本身。