统计学(50)-多水平模型

多水平模型打破“独立”条件
广义线性模型除要满足“线性”这一条件外,还有一个重要的条件就是“独立性" 。如果不满足线性条件,可以考虑广义可加模型;如果不满足独立性条件,则可以考虑多水平模型(Multilevel Model)。

1、什么是多水平?
image.png

(1)不难理解,所谓多水平数据,也就是自然形成的层次数据。
(2)在多水平数据中,最低层次称为水平1, 往上依次称为水平2 、水平3。如村民是水平1单位,村是水平2单位, 县是水平3单位。

2、多水平数据的非独立性

(1)调查30个村,每个村调查100人的饮食情况,对于每个村内的村民而言,他们很可能有类似的饮食习惯(如都喜欢吃咸),从而可认为村内的村民之间并不是独立的。
(2)观察60人,每人观测5个时间点,了解他们的血压值情况,对于同一个人而言,在5个时间点的血压值应该是差不多的,不会有太大的波动,从而可认为每个人的不同时间的观测值并不是独立的。

3、多水平模型的不同叫法

多水平模型在不同领域有不同的称谓,如分层线性模型(Hierarchical Linear Model) 、混合效应模型(Mixed Effect Model) 、随机效应模型(Random Effect Model) 、随机系数模型(Random Coefficient Model) 、方差成
分模型(Variance Component Model) 等,其实表达的意思都差不多,都是处理多水平数据的模型。

3、多水平模型的思想

(1)多水平模型的思想要稍微复杂一些,因为它同时包含了多个水平的数据,从而在多个水平上都存在残差。总的来说,其思想就是把高水平上的差异估计出来(传统的线性模型不考虑这一差异,将其放到了残差中),这就使得残差变小,估计的结果更为可靠。
(2)虽然理论上多水平模型可以有多个层次,但实际中最常用的是二水平模型。

4、一个例子-二水平模型

下表是12名儿童在30 、36 、42 、48个月时认知能力得分的测量结果(认知能力得分),目的是想了解年龄对认知能力得分是否有影响。(只标注出一部分)

image.png

该数据是一份二水平数据,其中儿童个体为水平2单位,测量的时间点为水平1单位。
如果用常规的线性模型拟合,就是将所有的48个数据建立线性模型。
image.png

(1)这个模型是将12名儿童的数据合起来建立的,因此有时也称合并模型(Pooled Model)。
它暗含了一个假定条件:12 名儿童的认知能力得分随年龄变化的截距和斜率都是相同的,而实际上却未必如此。(类似于4个社区SO2的统计结果)
(2)12 名儿童的认知能力得分随年龄的变化情况,可以看出,有的是随年龄增长,有的则是随年龄降低;即使在增长的儿童中,其增长速度也各不相同,有的增长快,有的增长慢。
(3)也就是说,每个人(水平2单位)的认知能力得分随年龄的变化可能有不同的截距和斜率,而传统线性模型则忽略了水平2单位上的差异。那么,既然它没有考虑到水平2单位上的差异,而水平2单位又确实存在差异,那这一差异去哪儿了呢?被线性模型归到误差中去了,
image.png

从而导致误差增大。
(4)怎样找出这种差异呢?
很自然的一个想法是利用虚拟变量回归,将12 名儿童的认知能力得分随年龄变化的截距差异和斜率差异估计出来,这样就可以反映出水平2 单位之间的差异,这种方法一般称为固定效应模型(Fixed Effect Model)。
但是固定效应模型有一个问题: 12名儿童就需要估计11个虚拟变量,当水平2单位更多的时候(如120名儿童),需要估计的参数太多,用虚拟变量就会消耗太多的自由度,估计结果不可靠,而且也没什么实际意义。因为我们并不关注具体谁和谁之间的差异有多大,我们只要知道这些儿童之间总的有多大差异就行了。这时候用固定效应模型就不大合适,而应采用随机效应模型(Random Effect Model), 也就是多水平模型。
(5)多水平模型
多水平模型是把水平2单位看作从一个更大的总体中随机抽样的个体,个体之间的差异是服从某种特定分布(如正态分布)的随机变动。这样,我们只要把这种分布的均数和方差估计出来,就可以反映出这些水平2 单位围绕均值的波动大小(变异大小)。不管是12人还是1200人,都只需要一个均值和方差便可以描述其变异大小。

5、多水平模型的分类

多水平模型根据实际情况一般可分为两大类:随机截距模型和随机斜率模型。
(1)随机截距模型
这种模型假定水平2 单位之间仅截距不同,斜率是相同的。如下图12名儿童的认知能力得分随年龄变化的斜率都相同,但截距不同。


image.png

(2)随机斜率模型
这种模型假定水平2 单位之间不仅截距不同,而且斜率也不同。下图12 名儿童的认知能力得分随年龄变化的截距和斜率都不同。


image.png

上述两类模型不做具体分析,只把握其思想,后续具体问题具体分析。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容