选择控制变量要遵循经济理论的指导,同时要使模型简洁,避免遗漏遗漏变量。遗漏变量与解释变量相关,会产生内生性问题,导致OLS 估计不一致。比如,研究教育投资回报时,个人能力因无法观测而,但能力与教育年限正相关。
建模策略
一是“由小到大”(specific to general)的建模方式首先从最简单的小模型开始,逐渐增加解释变量。小模型很可能存在遗漏变量偏差导致内生性。二是,“由大到小”(general to specific)的建模方式从尽可能大的模型开始,收集所有可能的解释变量,再逐步剔除不显著的解释变量(可依次剔除最不显著,即 p 值最大的变量)。虽然冒着包含无关变量的危险,但危害性没有遗漏变量严重。)
实际操作
由于很难找到与被解释变量相关的所有解释变量。实证研究中,常采用以上两种策略的折中方案。但有些期刊,包括权威期刊,建模策略是先只放核心解释变量进行估计,再逐步引入控制变量,如果核心解释变量正负性与显著性没有发生较大变化,则可以认为不存在严重的遗漏变量偏差。选择控制变量也可以参考一些权威期刊相关研究。