固定效应模型
固定效应模型假设所有效应量都来自一个单一的相同总体。它指出所有研究都具有相同的真实效应量。这个真实的效果是我们想要在meta分析中计算的整体效果大小,表示为 \theta。
我们可以这样描述这种关系:
虽然不知道研究的真实总体效应大小,但可以利用这种关系来对真实总体效应进行最佳估计 \hat\theta_k, 因此,在meta分析中汇集效应时,应该赋予具有更高精度(即更小的标准误差)的效应量更大的权重。
想计算固定效应模型下的合并效应大小,只需使用所有研究的加权平均值。一旦我们知道权重,我们就可以计算加权平均值,我们对真实合并效应的估计 :
这种方法是在meta分析中计算平均效应的最常用方法。因为我们使用方差的倒数,所以它通常被称为逆方差加权或简称为逆方差荟萃分析✍。
随机效应模型
固定效应模型假设我们所有的研究都是相同总体的一部分,并且观察到的效应差异的唯一原因是研究的抽样误差。如果我们要在没有抽样误差的情况下计算每项研究的效应量,那么所有真实的效应量将完全相同。
固定效应模型的假设在许多实际应用中可能过于简单💣。meta分析中的研究总是完全相同的,这是不现实的。研究往往会有所不同,即使只是微妙的方式。感兴趣的结果可能以不同的方式衡量。也许治疗的类型或治疗的强度和时间不完全相同。研究的目标人群可能并不完全相同,或者所使用的对照组可能存在差异。
meta分析中的研究很可能不仅在这些方面中的一个方面有所不同,而且在几个方面也有所不同。如果这是真的,我们可以预期真实效果的研究之间存在相当大的异质性。
所有这些都使固定效应模型的有效性受到怀疑。例如,如果一些研究使用了不同类型的治疗,那么一种形式比另一种更有效似乎是完全正常的。假设这些差异只是由研究的抽样误差产生的噪音,那将是牵强附会。
恰恰相反,研究的真实效果大小存在真正差异的原因可能有无数种。随机效应模型解决了这个问题。它为我们提供了一个模型,通常可以更好地反映数据背后的现实🕶。
在随机效应模型中,我们想考虑这样一个事实,即效应量显示出比从单个相同总体中提取时更大的方差。因此,我们假设个别研究的效果不仅因抽样误差而产生偏差,而且还有另一个方差来源。这一额外的方差分量是由于研究并非源于一个单一群体这一事实而引入的。相反,每项研究都被视为来自人群“宇宙”的独立抽取。
与固定效应模型类似,随机效应模型首先假设观察到的效应大小 \hat\theta_k 是研究真实效应大小 \theta_k 的估计值, 受抽样误差的影响 \epsilon_k 。
\hat\theta_k 代替 \theta 已经指出了一个重要的区别。随机效应模型仅假设\hat\theta_k是一项单一研究 k 的真实效应量. 它规定存在第二个误差源,表示为 \epsilon_k。第二个误差源是由以下事实引入的:即使是真实的效果大小 \theta_k 只是真实效应大小总体分布的一部分,均值 \mu 。
通过将第二个公式插入第一个公式,随机效应模型:
这个公式清楚地表明观察到的效应大小 \hat\theta_k 由于 \zeta_k 和 \epsilon_k 偏离了合并效应,这种关系如图所示:
因此,在包括医学和社会科学在内的许多领域中,通常总是使用随机效应模型,因为几乎总是可以预料到一定程度的研究间异质性。只有当我们无法检测到任何研究间的异质性,并且我们有很好的理由假设真正的效应是固定的时,才可以使用固定效应模型。例如,当仅考虑一项研究的精确复制时,或者当对一项大型研究的子集进行meta分析时,可能就是这种情况。毋庸置疑,这种情况很少发生,固定效应模型“在野外”的应用也相当罕见。
研究间异质性的估计
与随机效应模型相关的挑战是我们必须接受错误 \zeta_k 。为此,我们必须估计真实效应量分布的方差。这个方差被称为 \tau^2 或tau 平方。一旦我们知道了 \tau^2 的值,我们可以在确定每个效应大小的反方差权重时包括研究间的异质性。
在随机效应模型中,调整后的随机效应权重 w^*_k对于每个观察。公式如下所示:
使用调整后的随机效应权重,我们然后使用逆方差方法计算合并效应大小,就像我们使用固定效应模型一样:
有几种估计 \tau^2 的方法:
DerSimonian-Laird (
"DL"
)Restricted Maximum Likelihood (
"REML"
) or Maximum Likelihood ("ML"
)Paule-Mandel (
"PM"
)Empirical Bayes (
"EB"
)Sidik-Jonkman (
"SJ"
)
选择估算方法
确切地说应该使用哪个估计没有铁一般的规则。在很多情况下,各种估计产生的结果只会有细微的差别💬。
对于基于连续结果数据的效果大小,可以使用 ML 作为第一个开始。
对于二元效应大小数据,Paule-Mandel 估计是不错的首选,前提是样本大小没有极端变化。
当有充分的理由相信样本中效应的异质性非常大,并且如果避免误报具有非常高的优先级,使用 Sidik-Jonkman 估计。
如果希望其他人可以在R之外尽可能精确地重复的结果,选择DerSimonian-Laird 估计。
参考书籍:
- Doing Meta-Analysis in R.