一、重复测量方差说明
在数据分析中,尤其是在医学研究领域,往往存在大量重复数据,比如想要观测某药物疗效或者胎儿生长发育的规律等等,但是重复测量数据往往存在相关问题,也即说明数据之间存在不独立性,所以此类数据有别于一般数据,因而其分析方法也有别于一般的统计分析方法,此类数据就可以使用重复测量方差分析。
重复测量方差分析时涉及两个重要的术语名词,分别是组内和组间。组内项(被试内)表示同一对象被测试多次的标识项,比如一个班级10个男生他们之间的身高差异;组间项(被试间)表示不同对象组别的标识项比如男生身高和女生身高之间的差异。接下来从“例子与数据”、“分析前提条件”以及“重复测量方差分析”三个方面分别进行说明。
二、例子与数据
当前有一项关于抑郁症的研究,实验一共招募了12名患者,分别6名患者使用新药或者旧药,并且测试12名患者用药后分别第1周,第4周以及第8周时的抑郁程度(案例数据来源于SPSSAU帮助手册),部分数据如下:
(重复测量方差的数据格式特殊其中样本ID为一列,一个组内项为一列,一个组间项为一列,因变量为一列)。
三、分析前提条件
和大多数分析一样,一般在分析前都需要进行一些检验,重复测量方差需要检查数据是否存在异常值,以及因变量是否满足正态分布。
1.异常值
异常值分析数据中不正常的值,也称离群值。异常值的检验方法有很多,比如可以采用描述统计判断法(一般认为介于3倍标准差外的数据),或者箱线图等。这里使用描述统计进行判断。利用SPSSAU描述分析,结果如下:
从上述结果可以看到,共有36个样本,其中最小值为2,最大值为7,平均值为4.3,标准差为1.19,可以粗略的判断没有异常值。接下来查看因变量是否满足正态分布。
2.正态分布
判断数据是否符合正态分布有很多种方法,比如正态性检验(最为严格),描述统计法(查看偏度和峰度),以及图示法等等,这里使用描述统计法进行判断。
一般峰度绝对值小于10并且偏度绝对值小于3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。 如数据确实不符合正态性,可选择非参数检验进行分析。【参考文献:Kline R , Kline R B , Kline R . Principles and Practice of Structural Equation Modelling[J]. Journal of the American Statistical Association, 2011, 101(12).】
从结果中得到峰度为0.204,偏度为0.331,可以判断数据可以接受为正态分布。
四、重复测量方差分析
数据满足分析条件,接下来进行重复测量方差,分别从球形度检验、组内效应分析和事后多重比较以及简单效应分析四方面说明。
1.球形度检验
球形度检验用于检验不同测量之间的差值的方差是否相等。说明如下:
球形度检验可以看到p值小于0.05,所以没有通过球形度检验需要校正p值,并且球形度W值为0.463小于0.75,所以应该使用GG校正。接下来查看组内效应【特别提示:如果组内项水平数量为2(比如两个时间点)则不能进行球形度检验】。
2.组内效应分析
根据球形度检验发现需要校正p值,并且使用GG校正。从上表可以看出有两个效应分别为主效应(时间点)和二阶效应(交互效应,药物类型-时间点),发现主效应的p值为0.055<0.1,呈现0.1水平显著,二阶效应不显著。所以可以进一步查看事后多重比较进行时间的两两比较。
3.事后多重比较
如果主效应显著想要进一步两两之间比较,可以使用事后多重比较进行分析。SPSSAU提供多种事后多重比较方法,对于他们之间的差异可以查看帮助手册,这里选择Tukey方法(各组别的样本数量相同时使用),假如想要了解不同时间点之间抑郁程度是否有差别。结果如下:
通过事后多重比较发现只有第四周的数据和第8周的数据p值小于0.05,即存在差异。第四周的抑郁情况不同于第八周抑郁情况。
4.简单效应分析
简单效应是指简单效应指X1在某个水平时,X2不同水平的比较;因为该模型只存在主效应所以进行事后多重比较不进行简单效应分析。如果存在交互效应,则可以进一步分析简单效应。假如数据存在(以本例子为背景),分析第一周,新药和旧药的差别,然后分析第四周,新药和旧药的差别,分析第八周,新药和旧药的差别。
五、总结
本篇文章主要对重复测量方差分析进行说明,如果在做重复测量方差之前一定要整理好正确的数据格式然后进行分析,分析前可以简单的查看下数据,其中包括异常值,正态分布等等,然后正式分析,首先查看球形度检验,判断是否需要校正p值,紧接着进行组内效应分析,如果说主效应存在可以进一步分析事后多重比较,如果二阶效应(交互效应)存在,可以进一步分析简单效应,得到更多结论。