在科学研究中,假设检验是一个至关重要的统计工具。然而,在应用这一工具时,研究者常常面临两个关键问题:
-
第一个问题出现在实验设计的初始阶段:我们如何确定样本量?才能使研究既经济可行又具有统计学意义?这个问题不仅关系到研究的成本效益,还直接影响到统计分析的可靠性。
-
第二个问题则产生于假设检验完成之后:当我们获得p值小于0.05的结果时,是否就可以直接拒绝原假设?这个看似简单的问题实际上涉及到了统计推断的本质和局限性。
这两个问题的答案都与统计功效密切相关。功效分析(Power analysis)不仅能帮助我们在实验前确定合适的样本量,还能帮助我们更准确地解释实验结果。
一、假设检验
要理解功效,首先要对统计学的假设检验(原假设、备择假设)以及假设检验的两类错误(I类错误α、II类错误β)有一定的了解,下面进行简单介绍。
1、原假设与备择假设
在假设检验中,原假设(H0)与备择假设(H1)是两个相互对立的统计假设。
-
(1)原假设(H0):通常是研究者希望收集证据来反对的假设。它通常表述为一个无差异的声明。例如,两组之间没有差异。
-
(2)备择假设(H1):是研究者希望获得证据支持的假设。它通常表述为一个存在差异的声明。例如,处理组与对照组之间存在显著差异。
研究者可根据数据特征,选择适当的统计检验方法(如t检验、F检验、卡方检验等)来计算P值,P值反映了在原假设成立的条件下,观察到当前或更极端结果的概率。
-
若P值≤α(预设的显著性水平α),我们倾向于拒绝原假设,接受备择假设;
-
若P值>α,则不足以拒绝原假设。
2、假设检验中的两类错误
在假设检验过程中,可能会出现两类错误:
-
第 I 类错误(α):原假设(H₀)为真,但被错误拒绝
-
第 II 类错误(β):原假设(H₀)为假,但被错误接受
了解了以上假设检验的相关知识后,我们就可以很轻松的理解统计功效的概念。统计功效定义为1-β(Power值),即当原假设为假时,我们正确拒绝原假设的概率。关系如下表:
接下来,进入我们今天学习的主题——Power功效分析。
二、Power功效分析
Power功效分析是一种在实验研究设计阶段,基于预设的显著性水平α(通常为0.05)、期望的效应量和所需统计功效(1-β),计算适当样本量的统计方法,同时,它也可用于评估给定样本量的统计功效。
1、Power功效分析的主要作用
Power功效分析的主要作用是计算样本量以及确保研究有足够的统计功效来检测真实存在的效应。
-
确定样本大小:基于预期的效应大小、显著性水平和预设的功效水平(例如,80%或90%),计算出实验所需的样本量。
-
计算统计功效:评估在特定的样本大小、效应大小和显著性水平(通常是0.05)下,实验能够正确拒绝无效错误原假设的概率。
当前市场上能够进行Power功效分析的软件并不多,SPSSAU近期更新的算法就包括Power功效分析,可以帮助大家更高效地完成样本量和功效的计算。下文将介绍使用SPSSAU进行Power功效分析的软件操作。
2、功效Power的标准值
在Power功效分析中,功效Power的标准值通常设定为0.8,这意味着在进行假设检验时,有80%的概率能够在原假设为假时正确地拒绝原假设;换句话说,有20%的机会犯第二类错误。这个值被广泛接受为足够高的功效水平,能够确保研究具有较高的可靠性。
然而,根据研究领域的具体情况和重要性,研究者可根据需要调整功效水平。例如,在药物临床试验中,功效水平可能会设定为0.9或更高,以更严格地控制第二类错误的风险。在其他情况下,如果资源有限或者第一类错误的风险更为关注,可能会接受稍低的功效水平,如0.7。
2、功效Power的影响因素
统计功效(Power值)受到以下三个因素的影响:
-
①显著性水平α:其他条件保持不变,显著性水平越大,功效越大;
-
②样本量:其他条件不变,样本量越大,功效越大;
-
③两总体差异幅度:其他条件不变,两个总体参数之间差异越大,功效越大。
用户可通过SPSSAU【Power原理】演示图查看变量之间的变化趋势,该方法提供可视化方式直观理解Power功效分析的原理,如下图:
接下来介绍如何使用SPSSAU进行Power功效分析,包括样本量计算以及功效Power计算。
三、SPSSAU—Power功效分析
Power功效分析可以应用于多种统计检验和研究设计,来进行样本量与统计功效的计算。
1、Power功效分析类型
选择合适的power功效分析类型取决于研究设计、数据类型和研究假设。SPSSAU【Power】功效分析提供以下几类常见类型,如下图:
2、样本量计算
以均值差中的独立样本t检验为例进行计算样本量说明,其研究两组数据的均值差异,比如实验组和对照组的均值差异,那么预期(或者以往实验/以往文献)有着两组数据的平均值和标准差数据,并且基于预定好的α值和Power值,此时样本量应该多少适合呢?
SPSSAU软件操作如下图,依次选择Power功效分析目的、研究方法、基本参数,输入数据,点击开始分析即可:
SPSSAU输出Power功效分析样本量计算结果如下:
计算结果显示,基于I类错误为0.05,II类错误为0.2,Power值为0.8前提下,要想达到上述研究的差异具有科学判断性,此时第1组和第2组样本量均为41即可。
3、Power功效计算
接着以独立样本t检验为例进行Power功效值计算说明,有了两组数据的平均值和标准差数据,基于设定好的alpha值和样本量,此时power水平如何呢?
SPSSAU软件操作如下图,依次选择Power功效分析目的、研究方法、基本参数,输入数据,点击开始分析即可:
SPSSAU输出Power功效分析样本量计算结果如下:
计算结果显示,基于I类错误为0.05,两组数据样本量均为100,且两组数据的平均值和标准差值等均确定前提下,最终的功效Power值是0.994,即‘错的说成错的’即‘H0为假并且最终判断成假’这一情况的概率是99.4%,即对‘错的说成错的’这一情况有着很高的把握度。