先说明一个事情,我说的不一样,指的是大于1、小于1这个不一样,不是指数值的不同
上回,小张在丁香园问了一个问题:就是自己做多因素生存分析时,得出的HR和单因素的不同(就是大于1小于1这个),而我自己知道这个变量应该是单因素算出来的那样小于1的,所以我希望能找到原因。
当时有回答我说我可能是共线性,结果我搞了自己一天来研究共线性
结果不是因为这个
但是那一天之后,我离奇地在搜索资料的过程中,自己把自己解决了
今天就来聊聊可能的其他原因
#可能的原因是——变量设置
其实就是变量设置的问题,我把变量设置成了1和2;
特别是,我发现了这段话,愈发坚定我变量设置出了问题。
有时候我们要尊重软件设置的默认值,像我这种1234乱设置的人,注定要写这篇文章
#可能的原因是 样本量太小
这个是同学提到的,她在增大样本量的过程中,这个问题就解决了。我其实很想问她,会不会是随着你样本量的增加,数据的趋势本身就产生了变化
#可能的原因是 你需要换个方法
我于是解决了这个问题,并把enter、forward、stepwise都试了一遍,这几种方法的侧重点不一样而已,所以得出来的值会有轻微的不同。这个需要看你的研究目的。
前进法、后退法...细讲下这些自变量筛选方法!-医咖会www.mediecogroup.com
#当然,也不排除是共线性的问题
这个需要看另外一篇推文。
ENT小张:干货|多因素做cox生存分析,怀疑数据共线性了怎么办?——多重线性回归(一)zhuanlan.zhihu.com
后记:熬一锅毒鸡汤