这篇文章是前面共线性的延伸,
ENT小张:干货|多因素做cox生存分析,怀疑数据共线性了怎么办?——多重线性回归(一)zhuanlan.zhihu.com
用SPSS做出了多重线性回归的结果,你也不会看,所以我要接着再总结一番。
1.判断模型的线性拟合
R square是指回归中因变量变异被自变量解释的程度。本研究中,R square提示自变量可以解释12.8%的因变量变异。但是,R square是会夸大自变量对因变量变异的解释程度,如果模型中增加一个自变量,即使这个自变量在统计上并不显著,R square也会增大。
adjustedR2与R2不同的是,它剔除了自变量个数的影响,这使得adjustedR2永远小于R square,且adjusted R2的值不会由于自变量个数的增加而越来越接近1。
本研究中,adjustedR2=0.097,小于R square=0.128,校正了R square中总体自变量对因变量变异解释程度的夸大作用。在汇报结果时,adjustedR2更能代表自变量对因变量变异的解释程度。当然,如果能同时汇报adjusted R2和R square值更好。此外,adjusted R2也是影响程度的评价指标。
2.模型的统计学意义
3.结论怎么下,看斜率/截距
在SPSS中,截距被称为“Constant”,即0.357。实际上,我们并不是关注回归的截距指标。它是指当自变量值都为0时,因变量的值。这种截距值并不是真实存在的,为了避免对数据的过度挖掘,我们在这里不再进一步讨论。根据P值,我们可以判断截距的统计学意义。P=0.216,提示截距与0之间的差异无统计学意义。必须强调的是,无论截距的统计检验结果如何,是否有统计学意义,在进行多重线性回归时都无需十分关注这项指标,需要关注的指标是斜率。
斜率代表的是自变量每改变一个单位因变量的变化值。在本研究中,T分组的斜率为0.074,此外,我们也可以对斜率进行一些运算。斜率的95%CI——Sig栏可以得到斜率的统计学检验结果(P=0.399),提示斜率值与0的差异无统计学意义,也说明两者之间之间不存在线性关系。
值得注意的是,如果我们的变量是分类变量,比如T分组,那么就不能用连续变量的思维解释它。
多说一句
生存分析和线性回归的异同点在做过两个分析之后,再回去看它的定义,有了更深的体会。
主要区别就是一个是纳入了时间的考虑,还有消除了混杂因素的影响