倾向性匹配评分PSM(R实现)

基本知识

通过一定的统计学方法对试验组与对照组进行筛选，使筛选出来的研究对象在某些重要临床特征(潜在的混杂因素)上具有可比性

一般是通过某种统计学模型求得每个观测的多个协变量的综合倾向性得分，再按照倾向性得分是否接近进行匹配

最常用的统计模型一般是以分组变量为因变量，其它可能影响结果的混杂因素为协变量构建logistic回归模型

计算每个观测的倾向得分，按照得分大小进行匹配

代码实现(使用MatchIt包)

library(MatchIt)
library(tableone)
data(lalonde)
head(lalonde,4)
# treat age educ   race married nodegree re74 re75      re78
# NSW1     1  37   11  black       1        1    0    0  9930.046
# NSW2     1  22    9 hispan       0        1    0    0  3595.894
# NSW3     1  30   12  black       0        0    0    0 24909.450
# NSW4     1  27   11  black       0        1    0    0  7506.146

str(lalonde)
# 'data.frame': 614 obs. of  9 variables:
#   $ treat   : int  1 1 1 1 1 1 1 1 1 1 ...
# $ age     : int  37 22 30 27 33 22 23 32 22 33 ...
# $ educ    : int  11 9 12 11 8 9 12 11 16 12 ...
# $ race    : Factor w/ 3 levels "black","hispan",..: 1 2 1 1 1 1 1 1 1 3 ...
# $ married : int  1 0 0 0 0 0 0 0 0 1 ...
# $ nodegree: int  1 1 0 1 1 1 0 1 0 0 ...
# $ re74    : num  0 0 0 0 0 0 0 0 0 0 ...
# $ re75    : num  0 0 0 0 0 0 0 0 0 0 ...
# $ re78    : num  9930 3596 24909 7506 290 ...

#dput(names(lalonde))
preBL <- CreateTableOne(vars=c("treat","age","educ","race","married","nodegree","re74","re75","re78"),
                         strata="treat",data=lalonde,
                         factorVars=c("treat","race","married","nodegree"))
# treat是感兴趣变量,re78为结局变量
print(preBL,showAllLevels = TRUE)

image.png

f=matchit(treat~re74+re75+educ+race+age+married+nodegree,data=lalonde,method="nearest",ratio = 1)
# treat是感兴趣变量,re78为结局变量

summary(f)
# ...
# Sample Sizes:
#   Control Treated
# All           429     185
# Matched       185     185
# Unmatched     244       0
# Discarded       0       0

matchdata=match.data(f)

mBL <- CreateTableOne(vars=c("treat","age","educ","race","married","nodegree","re74","re75","re78"),
                         strata="treat",data=matchdata,
                         factorVars=c("treat","race","married","nodegree"))
print(mBL,showAllLevels = TRUE)

image.png

plot(f, type = 'jitter', interactive = FALSE)

image.png

可见race这个变量还是不平衡，使用卡钳值来解决

f1=matchit(treat~re74+re75+educ+race+age+married+nodegree,data=lalonde,method="nearest",caliper=0.05)

summary(f1)
# ...
# Sample Sizes:
#   Control Treated
# All           429     185
# Matched       109     109
# Unmatched     320      76
# Discarded       0       0
matchdata1=match.data(f1)

mBL1 <- CreateTableOne(vars=c("treat","age","educ","race","married","nodegree","re74","re75","re78"),
                      strata="treat",data=matchdata1,
                      factorVars=c("treat","race","married","nodegree"))
print(mBL1,showAllLevels = TRUE)

image.png

plot(f1, type = 'jitter', interactive = FALSE)

image.png

导出结果数据

library(foreign)
matchdata$id<-1:nrow(matchdata)

write.csv(matchdata1,"matchdata.csv")
# write.dta(matchdata,"matchdata.dta")

PSM的适用条件：对照组样本量足够大，对照组和试验组样本量之比5：1以上，确保绝大多数试验组对象可以匹配上合适的对照，最好所有试验组对象均得到良好匹配；

PSM与回归的关系：能用PSM的均可以用回归分析，可以用回归的未必可以用PSM。建议同时采用PSM和回归分析处理数据，当两者结果一致的时候说明结果较可信

参考资料
丁香园课程完整版R语言进阶之机器学习
 How to use R for matching samples (propensity score)

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,684评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,143评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,214评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,788评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,796评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,665评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,027评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,679评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,346评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,664评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,766评论 1赞 331
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,412评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,015评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,974评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,203评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,073评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,501评论 2赞 343

倾向性匹配评分PSM(R实现)

推荐阅读更多精彩内容