1、logistic的r2
logit模型结果中的准R2和后面的预测准确率都是判断其拟合好坏的指标。不过由于logit模型是一个非线性模型,所以准R2的计算一般只做一个参考。大家一般看预测准确率的。此外,准R2低也并不一定代表模型不好,它只是表示你模型中还遗漏了很多可能与因变量有关的自变量而已,只要这些遗漏的变量是外生的,就没问题的(而遗漏的变量是否严格外生,这点没法判断)。其实只要模型系数是显著的,整体是显著的就好的。
2、logistic的系数
系数的解释:
(1)根据《用stata学微观计量经济学》的说法,同一个模型,logit估计值大概是ols的5倍,probit估计值是ols的3倍。按照陈强《高级计量经济学及stata应用》,probit模型的相关系数之间难以进行比较,因而也是probit模型的劣势。
(2) 在stata的帮助文件中,提供了OR系数选项。or reports the estimated coefficients transformed to odds ratios, that is, exp(b) rather than b. Standard errors and confidence intervals are similarly transformed. This option affects how results are displayed, not how they are estimated. or may be specified at estimation or when replaying previously estimated results.
原始logit模型为下图
通过反对数操作可以解决难以解释系数的问题,
若在公式1 中三个系数分别为0.13 -1.29 0.68,则,取以e为底的幂后,变成了1.14,0.28,和0.51,即幂系数。
若工作年限的幂系数为1.14,则每多一年工作年限,使得劳动力参与比数(ρ∕1−ρ,即参与劳动与未参与劳动之比)增加了1.14倍,例如若工作12年的劳动参与比为4.88,则13年的参与比为5.56*1.14,
用更加直观的表述方式,将比数比减去1乘以100%,极为自变量一个单位变化带来的增加或减少的百分比。需要注意的是,这里指的是倍数的改变而非概率的改变。
3、异方差的处理
logit 回归采用hetprob选项进行检验,若h0被拒绝,则说明存在异方差问题
可以加robust 以及增加交互项,只要在构建模型前对数据做了一些预处理(如有偏态分布数据取对数,自变量间是否存在严重多重共线性等),那么最后的结果加不加robust对结果都影响不大的(变量的显著性不会发生太大改变,可能就是前后的标准误有一点点差别)。稳健的logit回归,建议做做交互项,再加点其它控制变量看你关注的变量是否依然显著。以此去判断是否稳健。
https://bbs.pinggu.org/forum.php?mod=viewthread&tid=4652489&page=1
也可以加入 robust 选项,进行怀特异方差修正,对比两个回归结果,判断系数差异程度
4、