有读者在公众号后台留言问下图应该如何实现
实现这个图的办法很多,今天的推文介绍使用R语言ggplot2包实现这个图的方法。
第一步是准备数据
部分数据集如下
总共4列
- 前两列是变量
- 第三列是相关系数
- 第四列是 显著性P值
前面的变量需要注意的是,因为只画上三角,所以准备数据的时候是 :
总共的变量是10个 第一列10个x1,接下来是紧接着9个x2,然后是8个x3
第一步树读入数据
df<-read.csv("20210320.csv",header=T)
head(df)
增加一列显著性的星号
library(dplyr)
df%>%
mutate(label=case_when(
signi<0.001 ~ "***",
signi>0.001&signi<0.01 ~ "**",
signi>0.01&signi<0.05 ~ "*",
TRUE ~ ""
)
) -> df1
接下来是作图
首先是上三角的气泡图
library(ggplot2)
ggplot(data=df1,aes(x=var_x,y=var_y))+
geom_point(aes(size=value,color=value))+
scale_color_gradient(low = "#80fcfe",high = "#ff80fc",
breaks=seq(-1,1,0.2))+
scale_size_continuous(range = c(5,15))+
guides(size=F)
这样的话X10的位置是不对的,所以要设置一下因子的水平
df1$var_x<-factor(df1$var_x,
levels = paste0("X",1:10))
df1$var_y<-factor(df1$var_y,
levels = paste0("X",1:10))
ggplot(data=df1,aes(x=var_x,y=var_y))+
geom_point(aes(size=value,color=value))+
scale_color_gradient(low = "#80fcfe",high = "#ff80fc",
breaks=seq(-1,1,0.2))+
scale_size_continuous(range = c(5,15))+
guides(size=F)
这样就对了
接下来是添加文字,首先把对角线那一列去掉
df1%>%
filter(var_x!=var_y) -> df2
head(df2)
ggplot(data=df1,aes(x=var_x,y=var_y))+
geom_point(aes(size=value,color=value))+
scale_color_gradient(low = "#80fcfe",high = "#ff80fc",
breaks=seq(-1,1,0.2))+
scale_size_continuous(range = c(5,15))+
guides(size=F)+
theme_bw()+
geom_text(data=df2,aes(x=var_y,y=var_x,
label=paste0(value,label)))
最后调整一下图例的高度
df1%>%
filter(var_x!=var_y) -> df2
head(df2)
ggplot(data=df1,aes(x=var_x,y=var_y))+
geom_point(aes(size=value,color=value))+
scale_color_gradient(low = "#80fcfe",high = "#ff80fc",
breaks=seq(-1,1,0.2))+
scale_size_continuous(range = c(5,15))+
guides(size=F)+
theme_bw()+
geom_text(data=df2,aes(x=var_y,y=var_x,
label=paste0(value,label)))+
theme(legend.key.height = unit(3.5,'cm'),
legend.justification = c(0,0),
legend.title = element_blank())
这样就做好了
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!