上一回梳理了病例对照研究和队列研究的区别,还顺便提到了OR值和RR值。
那么为什么回顾性的病例对照研究不能计算RR,只能计算OR,而队列研究可以计算OR和RR呢?
首先上一篇科研文中提到了OR值和RR值的意义——
1.OR值(odds ration)::在病例对照研究中,比值比指病例组中暴露与非暴露人数的比值和对照组中暴露与非暴露人数的比值的比。在队列研究中,指的是暴露组中患病与非患病者的比值和非暴露组中患病与非患病者的比值的比。
2.RR值(risk ration):是指暴露组累积发病率(或死亡率)/对照组累积发病率(或死亡率)。相对危险度表明暴露组发病率或死亡率是对照组发病率或死亡率的多少倍。说明暴露组发病或者死亡的危险性是非暴露组的倍数。RR值越大,表明暴露的效应越大,暴露与结局的关联的强度越大。
接下来从队列研究和案例对照研究中实例中探究两者的具体计算方式——
(1)队列研究
如我们要进行队列研究,常用的做法是找一群吸烟的人和不吸烟的人,随访若干年,看吸烟和不吸烟的人群中分别有多少人患肺癌的结果。如下图:
那么可以列出四格表,如下:
此时我们已知的是吸烟组中和不吸烟组中肺癌的发生率,也就是肺癌发生的风险(累积发病率),分别是:
R(吸烟组):a/a+c
R(不吸烟组):b/b+d
那么就可以得出——
RR=RR(吸烟)/RR(不吸烟)=(a/(a+c))/(b/(b+d))
也可以算出吸烟组和不吸烟组中肺癌发生的比值比:(a/c)/(b/d)
(2)病例对照研究:要进行病例对照研究,通常的做法是找一些肺癌患者和一些正常人作为对照,去回顾调查他们以前分别有多少人吸烟,如下图:
由此也可以做出一个四格表,如下——
此时由于无法知道肺癌组的发病率,因为我们只是寻找一些已经发生肺癌的人群,无法得知肺癌样本来源群体的发病率,只能通过比较肺癌组和正常人组里曾经吸烟的暴露频率,得出OR,也就是暴露比之比。
odds of case exposure=a/a+b
odds of control exposure=c/c+d
OR=(a/(a+b))/((c/(c+d))=ad/bc
OR值在某些情况下是可以代替RR值的:
我们可以看到RR的公式:
RR = (a/(a+c))/(b/(b+d))
我们假设肺癌的发病率很低(比如<10%,注意只是假设),那么a+c ~ c,b+d ~ d,所以有:
RR = (a/(a+c))/(b/(b+d)) ~ (a/c)/(b/d) = ad/bc=OR
就是说,当发病率很低时,可以用OR近似替代RR。
两者之间还有计算公式:
设疾病在非暴露人群中的发病为P0,则可用下列公式对RR校正:
RR = OR/((1-P0)+(P0*OR))
若P0未知,可以用b/(b+d)估计。
综上所述:病例对照研究中只能计算OR。
队列研究可以计算RR,其临床意义清晰(比如暴露组发病率是非暴露组发病率的多少倍),而OR的临床意义相对模糊且不好解释,所以一般不用OR。在一些特殊情况下也可以计算OR,比如Logistic回归中的模型中就使用了OR值来表示暴露于不暴露的发病情况。
最近想了想公众号的可以更新的内容,一是想把自己所学习的、遇到过的科研问题整理分享记录,而是继续坚持更一些有启发的文章,两者都会写,希望让读者有一些收获和思考。
文章来源:凡语人言公众号