1.2 LMM的简要历史
关于这个主题的一些历史视角是有用的。至少,虽然LMM可能似乎很难掌握起初,令人安慰的是,知道,几十人花了一百多年来整理出来。以下小节突出了导致LMM广泛使用的许多(但不是几乎所有)重要的历史发展。我们将关键的历史发展分为两类:理论和软件。本时间表中介绍的一些术语和概念将在本书后面更详细地讨论。对于其他历史视角,我们将读者引用到Brown&Prescott(2006)。
1.2.1关键理论发展以下时间线展示了LMM的理论基础的演变:
- 1861:单向随机效应模型(具有一个随机因子,没有固定因子的LMM)的第一个已知公式是Airy的,由Scheff'ein 1956进一步澄清.Airy在同一天晚上做了几次望远镜观察(聚类数据)的几个不同的夜晚,并分析数据分离的随机夜间效应的方差随机的夜间残差。
- 1863:Chauvenet在一个简单的随机效应模型中计算随机效应的方差。
- 1925:Fisher's book研究工作的统计方法概述了用于平衡数据的估计方差分量或将随机变化划分为来自不同来源的分量的一般方法。
- 1927:Yule假设在建立纯串行相关模型中,当前残差在有限数量的前述残差上的显式依赖性。
- 1931:Tippett将Fisher的工作扩展到线模框架中,将数量建模为由多个随机因素导致的随机变量的线性函数。他还阐明了一种估计随机效应方差的ANOVA方法。
- 1935:Neyman,Iwaszkiewicz和Kolodziejczyk检查了随机区块和拉丁方块设计的比较效率,并在其工作中广泛使用LMM。
- 1938年:费雪1925年第七版的工作讨论了类内相关系数(ICC)的估计。
- 1939:Jackson在一个随机因子和一个固定因子的LMM描述中假定随机效应和残差的正态性。这项工作在LMM的上下文中介绍了术语效应。 Cochran提出了一个用于不平衡数据的单向随机效应模型。
- 1940:Winsor和Clarke以及Yates,着重于在不平衡数据的情况下估计随机效应的方差.Wald考虑方差分量比率的置信区间。在这一点上,方差分量的估计仍然不是唯一的。
- 1941:Ganguli应用与随机效应相关的方差分量的ANOVA估计与嵌套混合模型。
- 1946:Crump将ANOVA估计应用于具有相互作用的混合模型。 Ganguli和Crump是第一个提到ANOVA估计可以产生与随机效应相关的方差分量的负估计的问题。 Satterthwaite使用方差分量估计的近似抽样分布,并定义了用于计算混合模型中近似F统计的近似自由度的过程。
- 1947:Eisenhart介绍了“混合模型”术语,并正式区分固定和随机效应模型。
- 1950:Henderson提供了随机效应和固定效应的BLUP是解的方程,称为混合模型方程(MME)。
- 1952:Anderson和Bancroft发表了“统计理论研究”一书,它提供了对平衡数据的方差分量估计的全面覆盖,并引入了嵌套随机效应模型中不平衡数据的分析。
- 1953:Henderson在生物统计学中产生了开创性的论文“估计方差和协方差分量”,重点是使用三个平方和方法之一来估计混合模型中不平衡数据的方差分量(常用III型方法,基于线性模型,但所有类型都可用于统计软件包)。各种其他论文在20世纪50年代末和60年代建立在这三种方法为不同的混合模型。
- 1965:Rao负责系统开发的增长曲线模型,一个具有共同的线性时间趋势的所有单位和单位特异性随机截距和随机斜率的模型。
- 1967:Hartley和Rao表明,使用最大似然法,使用从混合模型的矩阵表示得到的方程可以获得方差分量的独特估计(Searle等,1992)。然而,方差分量的估计向下偏移,因为该方法假定固定效应是已知的,而不是从数据估计。
- 1968:Townsend是第一个寻找方差分量的最小方差二次无偏估计量的人。
- 1971:Patterson&Thompson(1971)引入限制最大似然(REML)估计作为在具有不平衡数据的一般线性模型中估计方差分量(不假设固定效应是已知的)的方法。基于似然的方法发展缓慢,因为它们是计算密集型的。 Searle描述了具有一个随机因子的LMM中的估计方差分量的置信区间。
- 1972:Gabriel开发了阶数p的先前依赖的术语来描述一个模型,其中当前残差的条件分布,假定其前身,仅取决于其前辈。这导致一阶自回归AR(1)过程的发展(适用于个体随时间的等间隔测量),其中当前残余随机地取决于先前的残差。 Rao完成了最小范数二次无偏方程(MINQUE)估计的工作,该方法不需要随机效应或剩余项的分布形式(Rao,1972)。 Lindley和Smith介绍了HLM。
- 1976:Albert表明,没有任何分布假设,ANOVA估计是LMM中方差分量的最佳二次无偏估计量,以及在正态假设下的最佳无偏估计量。
- 20世纪70年代中期:LMMs经常应用于农业环境,特别是分裂地块设计(Brown&Prescott,2006)。
- 1982:Laird和Ware描述了在单个阶段拟合随机系数模型的理论(Laird&Ware,1982)。随机系数模型先前在两个阶段中处理:估计时间斜率,然后对个体的时间斜率执行分析。
- 1985年:Khuri和Sahai提供了估计方差分量的置信区间工作的全面调查。
- 1986:Jennrich和Schluchter描述了使用不同的协方差模型模型来分析重复测量数据以及如何在它们之间进行选择(Jennrich&Schluchter,1986)。 Smith和Murray将方差分量作为协方差,并使用基于二次形式的ANOVA程序从平衡数据估计它们.Green将完成对不平衡数据的该公式.Goldstein引入迭代重新加权的一般化最小二乘法。
- 1987:Self&Liang(1987)和后来的Stram&Lee(1994)的结果使得方差分量的显着性可行。
- 1990:Verbyla和Cullis在纵向数据设置中应用REML。
- 1994:Diggle,Liang和Zeger在三种类型的随机方差分量之间进行区分:随机效应和随机系数,串行相关(在时间上彼此接近的残差更接近于相距更远的残差)和随机测量误差(Diggle等,2002)。
- 20世纪90年代以后:LMM在医学中越来越流行(Brown&Prescott,2006)和社会科学(Raudenbush&Bryk,2002),他们也被称为多层模型或层级线性模型。
1.2.2关键软件开发一些重要的地标在这里突出显示:
- 1982:Bryk和Raudenbush首次发布了HLM计算机程序。
1988年:Schluchter和Jennrich首先介绍了用于非平衡重复测量模型的BMDP5-V软件例程。 - 1992:SAS引入proc混合作为SAS / STAT分析包的一部分。
- 1995:StataCorp发布了Stata Release 5,其提供了用于拟合具有与单个随机因子相关联的随机效应的模型的xtreg过程,以及使用广义估计方程(GEE)将拟合模型与面板数据进行拟合的xtgee过程。
- 1998:Bates和Pinheiro介绍了R软件包的通用线性混合效应建模函数lme()。
- 2001:Rabe-Hesketh et al。协作编写Stata命令gllamm用于拟合LMM(以及其他类型的模型)。 SPSS发布了第一版的MIXED过程作为SPSS 11.0版的一部分。
- 2005:Stata使得一般LMM命令xtmixed作为Stata Release 9的一部分可用,并且这将成为Stata Release 13中的混合命令.Bates为R软件包引入了lmer()函数。