R数据分析:再写潜在类别分析LCA的做法与解释

应粉丝要求,再给大家写一期潜在类别分析的教程,尽量写的详细一点。

首先,问题导入,啥是潜在类别分析?

Latent Class Analysis (LCA) is a statistical model in which individuals can be classified into mutually exclusive and exhaustive types, or latent classes, based on their pattern of answers on a set of (categorical) measured variables.

潜在类别分析就是依据个体在分类变量上的响应,将个体分为互斥的组,群,潜类别。

在这儿,组,群,潜类别都是一个东西,这儿大家注意,在潜在类别分析中响应变量或者说显变一定是分类变量,这个要和潜在剖面分析LPA区别开。

在做潜类别的时候你首先要设定你要你的数据有几个潜类别,我们的标准是拟合好的情况下尽可能选择最少的潜类别。

这儿值得注意的是,在R语言种poLCA的作者说过这么一段话:

He said, that he wouldn´t rely on statistical criteria to decide which model is the best, but he would look which model has the most meaningful interpretation and has a better answer to the research question.

也就是说最终你考虑到底你的数据有几个潜类别时,一定要考虑结果的可解释性。

今天还是给大家写一个系统的例子。

实例操练

我们要用到的R包为poLCA,在做潜类别分析的时候,我们的数据中不能有0,负值和小数点,还有,如果你的变量是二分类变量,一定不能编码为0、1,需要改为1,2。

跑潜在类别分析的语法

poLCA(formula, data, nclass=2, maxiter=1000, graphs=FALSE, tol=1e-10, na.rm=TRUE, probs.start=NULL, nrep=1, verbose=TRUE, calc.se=TRUE)

上面是poLCA包默认的语法参数,在自己跑的时候你可把graphs参数改成TRUE,这样就可以自动出图。

比如我们还是用上一篇文章中的samhsa2015.csv数据集跑,那么语法就可以写为:

f1 <- cbind(mhintake, mhdiageval, mhreferral, treatmt, adminserv)~1
LCA2 <- poLCA(f1, data=samhsa2015, nclass=2,graphs=TRUE)

运行后,我们就可以出图:

R数据分析:再写潜在类别分析LCA的做法与解释

图中有每个显变量,和两个潜类别在不同显变量上的响应概率以及两个潜类别中的个体数量占比。

循环语法

咱们自己做分析时,会遇到的情况是,我也不知道我到底该把潜类别数量固定为几个,所以我们需要一个一个去试,相信很多用Mplus的同学都有这种经历,需要把类别数量设定为不同的数,然后都跑一遍,然后把结果记下来,再比较选择最优的模型。

但是如果用R跑,我们可以写一个循环,让它一次性把所有可能给我们跑完,并输出最优模型,岂不是美滋滋。所以大家一定有必要掌握一门编程语言哦。

循环语法如下:

#循环所有可能数量的潜类别
max_II <- -100000
min_bic <- 100000
for(i in 2:10){
  lc <- poLCA(f, mydata, nclass=i, maxiter=3000, 
              tol=1e-5, na.rm=FALSE,  
              nrep=10, verbose=TRUE, calc.se=TRUE)
  if(lc$bic < min_bic){
    min_bic <- lc$bic
    LCA_best_model<-lc
  }
}       
LCA_best_model

大家只需要把自己的数据套进去就可以直接输出最优模型啦。

比如还是我们刚刚用的数据,直接运行循环语法:

max_II <- -100000
min_bic <- 100000
for(i in 2:10){
  lc <- poLCA(f1, samhsa2015, nclass=i, maxiter=3000, 
              tol=1e-5, na.rm=FALSE,  
              nrep=10, verbose=TRUE, calc.se=TRUE)
  if(lc$bic < min_bic){
    min_bic <- lc$bic
    LCA_best_model<-lc
  }
}       
LCA_best_model

上面的代码从2到10给你自动拟合10个模型,并输出最优bic的模型,运行时间有点长哈,我电脑跑了20分钟,大家耐心一点。

不过你不用设置跑2到10,一般情况跑2-5个潜类别就完全够用了。

我对我的数据跑完上面的代码后,得到如下结果

R数据分析:再写潜在类别分析LCA的做法与解释

就是说,其实我的数据适合做4个潜类别。

LCA画2D可视化语法

我们poLCA的自己出的图是3D的,我们也可以选择用ggplot2画2D的图出来,代码如下:

lcmodel <- reshape2::melt(LCA_best_model$probs, level=2)
zp1 <- ggplot(lcmodel,aes(x = L2, y = value, fill = Var2))
zp1 <- zp1 + geom_bar(stat = "identity", position = "stack")
zp1 <- zp1 + facet_grid(Var1 ~ .) 
zp1 <- zp1 + scale_fill_brewer(type="seq", palette="Greys") +theme_bw()
zp1 <- zp1 + labs(x = "Fragebogenitems",y="Anteil der Item-\nAntwortkategorien", fill ="Antwortkategorien")
zp1 <- zp1 + theme( axis.text.y=element_blank(),
                    axis.ticks.y=element_blank(),                    
                    panel.grid.major.y=element_blank())
zp1 <- zp1 + guides(fill = guide_legend(reverse=TRUE))
print(zp1)

运行后得到下图:

R数据分析:再写潜在类别分析LCA的做法与解释

这个如怎么解释呢?

我这个数据不是有5个变量嘛,意思就是指标告诉我们根据这5个变量把数据分为4个潜类别比较合适,上面这个图就是每一个潜类别在5个指标上的响应概率,因为我的每个指标都是2分类,pr(1)表示在相应指标响应1的概率,pr(2)表示在相应指标相应2的概率。

理解到这,我们就可以知道潜类别3在每个指标上响应2的概率都很大,而潜类别1在每个指标上响应1的概率都很大,以此类推,根据这些信息你就可以给你数据的每个潜类别进行命名啦。

你学会了嘛?

快快关注一波。

小结

今天又给大家写了潜类别的做法,感谢大家耐心看完,自己的文章都写的很细,代码都在原文中,希望大家都可以自己做一做,请关注后私信回复“数据链接”获取所有数据和本人收集的学习资料。如果对您有用请先收藏,再点赞转发。

也欢迎大家的意见和建议,大家想了解什么统计方法都可以在文章下留言,说不定我看见了就会给你写教程哦。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,179评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,229评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,032评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,533评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,531评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,539评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,916评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,813评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,568评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,654评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,354评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,937评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,918评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,152评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,852评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,378评论 2 342

推荐阅读更多精彩内容