R数据分析:双连续变量交互作用的简单斜率图作图及解释

Interaction: When the effect of one independent variable differs based on the level or magnitude of another independent variable

对于交互作用相信很多人都不陌生,论文中也会经常出现,大家自己也会想要看看感兴趣变量之间的交互,交互作用的意思就是在一个自变量的不同水平,另一个自变量的效应大小会有差别,这个和调节作用统计上基本上是一样的,两者只有理论意义上的差异。

今天就带大家用一个实际例子做一个交互作用

<u style="box-sizing: border-box; text-decoration: none; margin: 0px; padding: 0px; border: 0px;">y</u>*****<u style="box-sizing: border-box; text-decoration: none; margin: 0px; padding: 0px; border: 0px;"> = A + B + AB</u>

  • y = dependent variable
  • A = independent variable
  • B = independent variabile
  • A*****B = interaction between A and B

上面的这个公式就是最简单的,有交互作用的回归,对于此方面的详尽解释,大家可以参考文献:*Jaccard & Turrisi 2003 *Interaction Effects in Multiple Regression

今天重点给大家写两个连续变量的简单斜率图和解释:

两连续变量的交互

先模拟出我们今天的数据集:

library(car) 

#此部分为数据的模拟  
n <- 250    
#模拟两个正态分布的连续变量
X <- rnorm(n, 2.75, .75)    
Z <- rnorm(n, 15, 15)   
#模拟因变量    
Y <- .7*X + .3*Z + 2.5*X*Z + rnorm(n, sd = 5)
#因变量转化
Y = (Y - min(Y)) / (max(Y) - min(Y))*4
#生成我们的数据
GPA.Data <- data.frame(GPA=Y, Work.Ethic=X, IQ=Z) 

上面的代码生成一个模拟的数据框,我们假设应变量是学生的GPA,两个自变量分别是学习态度和智商,我们文章要探讨的就是学习态度和智商在影响GPA时的交互作用。

此时智商和态度都是正态分布的连续变量。

首先拟合模型:

GPA.Data$IQ.C <- scale(GPA.Data$IQ, center = TRUE, scale = FALSE)
GPA.Data$Work.Ethic.C <- scale(GPA.Data$Work.Ethic, center = TRUE, scale = FALSE)

GPA.Model.1 <- lm(GPA~IQ.C+Work.Ethic.C, GPA.Data)
GPA.Model.2 <- lm (GPA~IQ.C*Work.Ethic.C, GPA.Data)

library(stargazer)
stargazer(GPA.Model.1, GPA.Model.2,type="html", 
          column.labels = c("Main Effects", "Interaction"), 
          intercept.bottom = FALSE, 
          single.row=FALSE,     
          notes.append = FALSE, 
          header=FALSE,
          out="test.html",
          out.header=TRUE) 

上面的代码进行了有交互和没有交互时的模型拟合,同时我还用了stargazer来输出模型结果:

R数据分析:双连续变量交互作用的简单斜率图作图及解释

可以看到交互作用是有的,下面准备画简单斜率图:

简单斜率图

两个连续变量放在回归方程中很好理解,在做交互的简单斜率图的时候我们就得指定水平比如AB两个连续变量有交互作用,我们如果以A为x轴做简单斜率图,我们需要表达的是A的效应随着B的不同水平的不同而不同。

然而B是一个连续变量,所以我们此时得给B指定作图的水平。

指定水平时一般有三种方法:hand picking, quantiles, standard deviation。

我们先来看hand picking:

library(effects)
Inter.HandPick <- effect('IQ.C*Work.Ethic.C', GPA.Model.2,
                                              xlevels=list(IQ.C = c(-15, 0, 15),
                                              Work.Ethic.C = c(-1.1, 0, 1.1)),
                                              se=TRUE, confidence.level=.95, typical=mean)

Inter.HandPick <- as.data.frame(Inter.HandPick)
head(Inter.HandPick)

可以看到在我们指定的不同水平都有拟合系数均值:

R数据分析:双连续变量交互作用的简单斜率图作图及解释

有了上面的数据我们就可以做简单斜率图了:

Inter.HandPick$IQ <- factor(Inter.HandPick$IQ.C,
                      levels=c(-15, 0, 15),
                      labels=c("1 SD Below Population Mean", "Population Mean", "1 SD Above Population Mean"))

Inter.HandPick$Work.Ethic <- factor(Inter.HandPick$Work.Ethic.C,
              levels=c(-1.1, 0, 1.1),
              labels=c("Poor Worker", "Average Worker", "Hard Worker"))

library(ggplot2)                
Plot.HandPick<-ggplot(data=Inter.HandPick, aes(x=Work.Ethic, y=fit, group=IQ))+
      geom_line(size=2, aes(color=IQ))+
      ylim(0,4)+
      ylab("GPA")+
      xlab("Work Ethic")+
      ggtitle("Hand Picked Plot")

Plot.HandPick 

运行以上代码即得到简单斜率图:

R数据分析:双连续变量交互作用的简单斜率图作图及解释

因为我们选择的B的水平是levels=c(-15, 0, 15),而我们模拟的B也就是IQ的分布是一个以15为均值15为标准差的正态分布,而后进行了中心化,所以我们画简单斜率图选择的这个水平levels=c(-15, 0, 15)就是均值和加减一个标准差的水平。这个是我们自己选的,所以叫做hand picking。

对于这个简单斜率图的解释如下:

对于IQ均值在总体均值一个标准差以上的这些人,他们的学习态度越好那么GPA也越好,在普通IQ的学生中也有这么一种关系,但是比较弱一点,但是对于那些IQ低于人群一个标准差的同学,他们的学习态度再好,GPA好像也不增加。


我们接着看另外一种划分水平的方法---quantiles

首先我们将我们的B的水平****化****出来:

IQ.Quantile <- quantile(GPA.Data$IQ.C, probs=c(0,.25,.50,.75,1))
IQ.Quantile <- round(IQ.Quantile, 2)

其余的步骤和基本就一样了,依然还是先跑我们的B的不同水平的系数均值:

library(effects)

Inter.Quantile <- effect('IQ.C*Work.Ethic.C', GPA.Model.2,
                                      xlevels=list(IQ.C = c(-35.44, -9.78, -0.04, 9.89, 41.90),
                                      Work.Ethic.C = c(-1.1, 0, 1.1)),
                                      se=TRUE, confidence.level=.95, typical=mean)

Inter.Quantile <- as.data.frame(Inter.Quantile)

Inter.Quantile$IQ<-factor(Inter.Quantile$IQ.C,
                      levels=c(-35.44, -9.78, -0.04, 9.89, 41.90),
                      labels=c("0%", "25%", "50%", "75%", "100%"))

Inter.Quantile$Work.Ethic<-factor(Inter.Quantile$Work.Ethic.C,
              levels=c(-1.1, 0, 1.1),
              labels=c("Poor Worker", "Average Worker", "Hard Worker"))

然后再画图:

library(ggplot2) 
Plot.Quantile<-ggplot(data=Inter.Quantile, aes(x=Work.Ethic, y=fit, group=IQ))+
      geom_line(size=2, aes(color=IQ))+
      ylab("GPA")+
      xlab("Work Ethic")+
      scale_color_manual(values=c("#42c5f4","#54f284","#f45dcc",  
                             "#ff9d35","#d7afff"))+ 
      theme_bw()+ 
      theme(text = element_text(family="Impact", size=14, color="black"))+ #可以在这换字体
      ggtitle("Quantile Plot")

Plot.Quantile
R数据分析:双连续变量交互作用的简单斜率图作图及解释

对于上面图的解释相信大家都会了,这儿不多罗嗦,直接继续看第三种划分水平的方法


第三种划分水平的方法叫做Standard Deviation

其实我们第一种方法就是按照标准差划分的,所以这个做出来的图和第一种方法基本没有区别,首先还是水平划分:

IQ.SD <- c(mean(GPA.Data$IQ.C)-sd(GPA.Data$IQ.C),
           mean(GPA.Data$IQ.C),
           mean(GPA.Data$IQ.C)+sd(GPA.Data$IQ.C))

IQ.SD <- round(IQ.SD, 2)

然后做交互,得出系数均值:

Inter.SD <- effect(c("IQ.C*Work.Ethic.C"), GPA.Model.2,
                     xlevels=list(IQ.C=c(-14.75, 0, 14.75),
                                  Work.Ethic.C=c(-1.1, 0, 1.1))) 

Inter.SD <- as.data.frame(Inter.SD)

Inter.SD$IQ<-factor(Inter.SD$IQ.C,
                      levels=c(-14.75, 0, 14.75),
                      labels=c("1 SD Below Mean", "Mean", "1 SD Above Mean"))

Inter.SD$Work.Ethic<-factor(Inter.SD$Work.Ethic.C,
              levels=c(-1.1, 0, 1.1),
              labels=c("Poor Worker", "Average Worker", "Hard Worker"))

然后再出图:


Plot.SD<-ggplot(data=Inter.SD, aes(x=Work.Ethic, y=fit, group=IQ))+
      geom_line(size=1, aes(color=IQ))+ 
      geom_point(aes(colour = IQ), size=2)+ 
      geom_ribbon(aes(ymin=fit-se, ymax=fit+se),fill="gray",alpha=.6)+ 
      ylim(0,4)+ 
      ylab("GPA")+ 
      xlab("Work Ethic")+ 
      ggtitle("Standard Deviation Plot")+ 
      theme_bw()+ #Removes the gray background 
      theme(panel.grid.major=element_blank(),
          panel.grid.minor=element_blank(),
          legend.key = element_blank())+ #Removes the lines 
     scale_fill_grey()
Plot.SD
R数据分析:双连续变量交互作用的简单斜率图作图及解释

此图的解释和第一种方法一模一样哈。

小结

今天给大家写了回归中双连续变量交互作用的简单斜率图的画法和解释,之后会给大家写有分类变量的交互,感谢大家耐心看完。发表这些东西的主要目的就是督促自己,希望大家关注评论指出不足,一起进步。内容我都会写的很细,用到的数据集也会在原文中给出链接,你只要按照文章中的代码自己也可以做出一样的结果,一个目的就是零基础也能懂,因为自己就是什么编程基础没有从零学Python和R的,加油。数据分析问题咨询,代处理请私信。

(站外链接发不了,请关注后私信回复“数据链接”获取本头条号所有使用数据)

往期内容:

R数据分析:双因素方差分析与交互作用检验

python机器学习:机器学习模型评价-交叉验证与留一验证

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,524评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,869评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,813评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,210评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,085评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,117评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,533评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,219评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,487评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,582评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,362评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,218评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,589评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,899评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,176评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,503评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,707评论 2 335

推荐阅读更多精彩内容