单因素分析和多因素分析的结果不一致

我们在做统计分析时，常常都习惯了这样的分析套路：先进行统计描述，然后做单因素分析，最后再进行多因素分析。在阅读文献时，我们也会发现，不管是一般的统计描述还是单因素分析，往往能够支持研究人员作出结论的，还是要看最终的多因素分析结果。

在前期推送的内容中我们也讲过，多因素分析的目的是通过控制其它多个混杂因素的影响，找出具有独立作用的影响因素，并估计其效应大小。

既然这样的话，做单因素分析还有什么用呢，直接做多因素分析不就好啦？

多因素分析的地位固然重要，但是单因素分析也必不可少，单因素分析可以为多因素分析提供很多有效的信息，将单因素和多因素分析的结果进行比较，也能发现很多问题。如果单因素和多因素分析的结果一致的话，结论就比较稳定且容易解释，但是我们常常会遇到单因素和多因素分析的结果不一致，甚至是出现相互矛盾的尴尬情况，此时又该怎么办，该如何去解释呢？

今天我们就来一起聊一聊单因素分析和多因素分析之间的爱恨情仇。

首先我们根据单因素分析和多因素分析的结果对比，将可能出现的情况做一个四格表，如表1所示，分为A、B、C、D一共4种情况，下面我们分别对这四种情况进行讨论。

image

情况A

单因素分析和多因素分析的结果都显示无统计学显著性，****两者结果一致，均为阴性结果

在这种情况下，结果还是相对比较好解释的，一般基本上可以认为该因素对于结局事件来说，不是一个有意义的影响因素。

但是事情也并非这么简单，如果该因素作为一个混杂因素，在多因素分析中只是用来起到调整混杂作用的目的，那么虽然它在单因素和多因素分析中都是阴性结果，可能也不会太引起研究人员的重视；但是如果该因素是研究中所重点关注的一个因素，例如暴露/处理因素，此时单因素和多因素分析都得出阴性结果的话，就会让人感觉比较沮丧，不过也更值得我们好好去思考一下阴性结果背后的意义。

到底是该暴露/处理因素对结局事件真的没有影响，还是说因为其他原因而导致它的实际效应没有被显示出来？到底是研究设计的问题，还是指标定义的问题，亦或是统计方法的问题呢？都需要我们认真去查找一下原因，可以参考前期推送的有关介绍“阴性结果”的系列文章，或许可以帮助你寻找一下产生阴性结果的原因，开拓一下分析思路。

情况B

单因素分析结果显示无统计学显著性，****但多因素分析结果显示有统计学显著性

这种情况可能并不常见，主要是因为在单因素分析中没有统计学显著性的因素，按照一般的做法就不会再将此变量纳入到多因素分析中了，但其实上述做法小咖并不推荐，它是存在一定缺陷的。

我们在前期介绍《如何理解回归模型中的“调整”和“独立作用”》的内容中讲到，在单因素分析中，由于自变量之间存在一定的相互关联，自变量对因变量的影响反映的不仅仅单纯是它本身的作用，而是包含了该变量自身作用以及其他变量的混杂作用之后，呈现出来的一个综合的结果。而在多因素分析中，通过构建回归模型，调整了其他混杂因素的影响，从而才使该因素对因变量的真实效应显示出来。

因此不难理解，当某因素在单因素分析结果中无统计学显著性，而多因素分析结果有统计学显著性时，此时可能的原因是，该因素与其他混杂因素之间可能存在一定的关联，在单因素分析时，该因素的真实效应被其他混杂因素的作用所掩盖，通过多因素分析消除其他因素的影响后，才发现原来该因素对于结局事件来说是具有独立作用的。

举一个例子，例如某因素A是一个危险因素，而因素B是一个保护因素，由于具有因素A的个体，大部分人同时也具有因素B，因此在单因素分析中，因素A的作用并没有显现出来，这是因为因素A的危险作用被因素B的保护作用所掩盖了，无法体现因素A的实际效应。而通过多因素分析，将因素B的保护作用进行调整，从而暴露出因素A真实的危险作用。

情况C

单因素分析结果显示有统计学显著性，****但多因素分析结果显示无统计学显著性

想必大家都会经常遇见到这种情况，单因素分析时该因素有统计学显著性，然后就很兴奋地把它扔进多因素分析中，结果多因素分析结果却显示没有统计学显著性，感觉前功尽弃，很让人头痛，不知道是出了什么问题，到底该怎么办了。

我们仍然以前期推送的《传统单因素分析和单因素回归分析》一文中所引用的研究为例，如表2和表3所示。

表2. 研究对象基线特征

image

表3. 单因素和多因素Cox回归结果

image

文章中传统的单因素分析结果显示，Non-HDL-C平均水平在发生心血管疾病组要高于对照组，两组水平分别为124mg/dL和114mg/dL，差异有统计学显著性(P<0.01)；

然后作者进行了单因素回归分析，其结果显示Non-HDL-C对于心血管疾病的发生是一个危险因素，HR=1.45，95%CI为1.11-1.88(P<0.01)；

最后作者又进行了多因素回归分析，结果显示Non-HDL-C对于心血管疾病发生的影响消失了，没有统计学显著性，HR=1.77，95%CI为0.98-3.15(P：No Significance)。为什么会出现这样的情况呢？

如果你对情况B产生的原因已经理解，那么情况C也是同样的道理。在单因素分析中，自变量与因变量之间可能出现一定的假关联或者是间接的关联，例如某因素A对结局事件并无影响，而因素B对于结局事件是一个影响因素，但是由于因素A只是单纯的和因素B有强烈的相关性，两者存在共线性的现象，那么在单因素分析中，就可能出现因素A也存在显著差异的结果，从而导致因素A被误认为是一个影响因素而纳入到多因素分析中。

而在多因素分析中通过调整因素B的影响，因素A与因变量的“假关联”就消失了，此时可以认为因素A实际上对于结局事件并非是一个影响因素。就如同上述研究中的Non-HDL-C这个指标，在单因素分析中，它与心血管疾病的关联受到其它因素的影响，可能只是一种“假关联”，这种“假关联”在多因素分析中就很容易被调整而消失。

(注：针对Non-HDL-C这个指标，本文只从统计结果的角度将该研究作为例子进行讲解，不对Non-HDL-C作专业上的解释，具体意义需结合临床)

情况D

单因素分析和多因素分析的结果都显示统计学显著性，两者结果一致，均为阳性结果

这种情况应该是大家最愿意看到的情况吧，往往单因素和多因素分析都出现阳性结果，以此结果作出的结论还算是比较稳定可靠，可以放心地写文章投稿了，但前提是单因素和多因素分析的阳性结果的方向是一致的，比如单因素分析显示病例组某因素的水平显著高于对照组，多因素分析也显示该因素为危险因素，两者的结果都倾向于该因素对结局事件具有危险作用。

不过偶尔也会遇见这样的情况，虽然单因素和多因素分析都得出阳性结果，但是有时单因素分析显示为危险因素，而多因素分析显示为保护因素，或者单因素分析显示为保护因素，而多因素分析显示为危险因素，两者的结果是相互矛盾的。

出现这样的情况，其实和上述的情况B和C是同样的道理，这是在统计分析中经常出现的一个陷阱，统计学上称之为“辛普森悖论”(Simpson’s Paradox)，是由英国统计学家E.H.Simpson于1951年提出。简单理解就是，在某个条件下的两组数据，分别讨论时都会满足某种性质，可是一旦将两组数据合并考虑，却可能导致相反的结论。

我们今天讨论的单因素分析和多因素分析的结果出现不一致的情况，就是一个典型的“辛普森悖论”的例子。在单因素分析中，由于没有考虑到其他因素的影响，在一定情况下就会发生“辛普森悖论”，然而在多因素分析中，通过调整控制其他因素的影响，就可以解开“辛普森悖论”之谜，这也是一个很有意思的现象。有兴趣的小伙伴可以先查阅一下有关“辛普森悖论”的资料，我们将在以后的内容中向大家进行介绍。

参考文献

1. Atherosclerosis. 2011 Sep;218(1):163-7

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,732评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,496评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,264评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,807评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,806评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,675评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,029评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,683评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,704评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,666评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,773评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,413评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,016评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,204评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,083评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,503评论 2赞 343

单因素分析和多因素分析的结果不一致

推荐阅读更多精彩内容