如果多组间比较认为总体上有统计学差异,通常还可以进一步做组间两两比较。两两比较的方法有很多,SPSS就提供了20余中,多到令人尴尬,令人不知如何选择。
常用的两两比较方法
LSD:实际上是 t 检验的改进,在变异和自由度的计算上利用了整个样本信息,而不仅仅是比较两组的信息。它的敏感度最高,在比较时仍然存在放大α水准(一类错误)的问题,换言之就是总的二类错误非常小,要是LSD法都没有检验出有差别,恐怕真的没差别了。
Bonferroni:由 LSD 法修正而来,通过调整每个检验的α水准来控制总的α水准,最终保证总的α水准为0.05,该方法敏感度介于 LSD 法和 Scheffe 法之间。
S-N-K:即 Student Newman Keuls 法,是应用最广泛的一种两两比较方法。它采用Student-Range 分布进行所有组均值间的配对比较。该方法保证在H0真正成立时总的α水准等于实际设定值,即控制了一类错误。
TUKEY:即 Tukey's honestly significant difference 法(Tukey’s HSD),采用 Student-Range 统计量进行所有组间的两两比较。但与 S-N-K 法不同的是,它控制的所有比较组中最大的一类错误概率不超过α水准。
Scheffe:当各组人数不相等,或者想进行复杂比较时,用此法较为稳妥。它检验的是各个均数的线性组合,而不是只检验某一对均数间的差异,并控制总体的α水准等于0.05。正因如此,它相对比较保守,有时候方差分析F值差异有统计学意义,用该法做两两比较也找不出差异来。
Dunnett:主要用于多个实验组与一个对照组的比较,实验组之间不做比较。
如何选择两两比较方法
如何在如此之多的两两比较方法中选出合适的方法是一个令人头痛的问题。由于 S-N-K 法的结果阅读非常方便。以前国内都以 S-N-K 法最常用,但根据近年来的研究发现,当两两比较的次数极多时,该方法的假阳性非常高,因此当比较次数较多时(例如有10组作两两比较,则比较次数会有45次),对用S-N-K法得到的有统计学意义的结论要谨慎一些。
根据相关研究的检索结果,除了参照所研究领域的惯例外,一般可以参照的标准为:
- 如果存在明确的对照组,要进行验证性研究,即计划好的某两个或几个组间(和对照组)的比较,适宜用 Bonferroni(LSD)法;
- 若需要进行多个均数间的两两比较(探索性研究)且各组人数相等,适宜用 Tukey法;
- 其它情况适宜用Scheffe法。