一、调节顺序
有的时候我们需要调节x轴,y轴或者图例的标签顺序,这个时候当然方法不知一种,我们这里写一种常用的方法供大家参考:
###调节图例的顺序(以fill为例)
scale_fill_discrete(values = col, limits= c('B','C','A')) ###limits的顺序就是图例的顺序
####调节x轴的顺序
scale_x_discrete(limits= c('B','C','A')) ###可以设定x轴因子的标签顺序
scale_y_discrete(limits= c('B','C','A')) ###可以设定y轴因子的标签顺序
#####这是常见的三种方法,当然还有其他方法,如下:
data$group <- factor(tt.data$group, levels=c("B", "A", "C","D"), ordered=TRUE)
####设置group为x轴的标签,且指定因子顺序。
二、特定的线段加箭头
p + geom_segment(aes(x = 2, y = 15, xend = 2, yend = 25),
arrow = arrow(length = unit(0.5, "cm"))) ###线段可以指定为变量,一次来添加多个箭头
三、添加标签
添加标签的函数为geom_text和geom_label ,仅有的区别在于geom_label 会对每个标签添加一个方框作为背景。
geom_text(aes(label=proportion, y=proportion+0.05), position=position_dodge(0.9), vjust=0) ##aes的功能在于添加映射,调整y的位置,geom_label的功能相同。
里面的参数有一个需要注意:
data = NULL 这里一般我们需要特制数据来映射标签
四、添加特殊位置的点(四分位点等)
计算一组数据特定的分为点用函数quantile(x, probs = c(0.2,0.9)),x是一组数据,probs指定特定的分位点,这里我们取用的就是数据10分位值的第二个和第九个。
那我们画小提琴图或者柱形图如何来添加这个位点呢?
p+stat_summary(fun.y=mean,geom='point',shape=23,size=0.5,col='white')
参数需要注意的是:
aes里面的映射,fun.y就可以指定函数,这里可以指定quantile返回的值,其他参数均为常见的参数。
五:有时候我们需要把相同组用一个圆圈给特别划定出来,如下图
这个时候我们就需要ggplot2的stat_ellipse函数了
stat_ellipse(aes(x = X, y = Y, fill = group), geom = "polygon", alpha = 1/2, levels = 0.95) ###这里的参数需要注意的是参数设置的问题
大家可以尝试
这里就和大家分享这么多,肯定还有很多我们不知道的一些绘图细节,大家可以提出来一起学习和进步
增加图例中点的大小,设置一列图例
guides(colour = guide_legend(override.aes = list(size=10),ncol = 1))
分面中分面标签的大小和背景
strip_text和strip_background
3. 堆叠小提琴图展示marker基因
相比于其他可视化形式,小提琴图可以更直观地展示某一类亚群的某一个基因的表达分布情况。我的marker基因一共选了12个,下面来画图:Seurat内置的VlnPlot函数可以直接画,
library(xlsx)markerdf2=read.xlsx("ref_marker2.xlsx",sheetIndex = 1)markerdf2$gene=as.character(markerdf2$gene)mye.seu=readRDS("mye.seu.rds")mye.seu$celltype=factor(mye.seu$celltype,levels = sort(unique(mye.seu$celltype)))Idents(mye.seu)="celltype"VlnPlot(mye.seu, features = markerdf2$gene, pt.size = 0, ncol = 1)+ scale_x_discrete("")+ theme( axis.text.x.bottom = element_blank() )ggsave("vln1.pdf",width = 20,height = 80,units = "cm")
其中pt.size
参数表示点的大小,一个点就是一个细胞,一般可以直接设置为0,即不显示点,只画小提琴,看上去更加清楚。尽管此处我对标度和主题进行了调整,但我发现这只对单个feature有用,多个feature时就不起作用了,后续就用AI来简单编辑一下吧。需要注意的是,图的颜色是根据亚群的类别来划分的,并不是根据基因来区分。
第二种方法,ggplot2代码如下
library(reshape2)vln.df=as.data.frame(mye.seu[["RNA"]]@data[markerdf2$gene,])vln.df$gene=rownames(vln.df)vln.df=melt(vln.df,id="gene")colnames(vln.df)[c(2,3)]=c("CB","exp")#数据格式如下# > head(vln.df)# gene CB exp# 1 CLEC9A N01_AAACGGGCATTTCAGG_1 0.000# 2 RGCC N01_AAACGGGCATTTCAGG_1 0.000# 3 FCER1A N01_AAACGGGCATTTCAGG_1 0.000# 4 CD1A N01_AAACGGGCATTTCAGG_1 0.000# 5 FSCN1 N01_AAACGGGCATTTCAGG_1 1.104# 6 CCR7 N01_AAACGGGCATTTCAGG_1 0.000anno=mye.seu@meta.data[,c("CB","celltype")]vln.df=inner_join(vln.df,anno,by="CB")vln.df$gene=factor(vln.df$gene,levels = markerdf2$gene) #为了控制画图的基因顺序vln.df%>%ggplot(aes(celltype,exp))+geom_violin(aes(fill=gene),scale = "width")+ facet_grid(vln.df$gene~.,scales = "free_y")+ scale_fill_brewer(palette = "Set3",direction = 1)+ scale_x_discrete("")+scale_y_continuous("")+ theme_bw()+ theme( axis.text.x.bottom = element_text(angle = 45,hjust = 1,vjust = 1), panel.grid.major = element_blank(),panel.grid.minor = element_blank(), legend.position = "none" )ggsave("vln2.pdf",width = 11,height = 22,units = "cm")
geom_violin()函数的scale参数为"width"时,所有小提琴有相同的宽度,默认是"area",有相同的面积;facet_grid()用来分面,文中用的是多行一列,scales = "free_y"表示不同行之间可以有不同范围的y值;scale_fill_brewer()使用ColorBrewer调色板。
这个图的颜色根据基因来区分,有时可能还会看到小提琴图的颜色是用亚群某个基因的表达均值来映射的,比如
vln.df$celltype_gene=paste(vln.df$celltype,vln.df$gene,sep = "_")stat.df=as.data.frame(vln.df%>%group_by(celltype,gene)%>%summarize(mean=mean(exp)))stat.df$celltype_gene=paste(stat.df$celltype,stat.df$gene,sep = "_")stat.df=stat.df[,c("mean","celltype_gene")]vln.df=inner_join(vln.df,stat.df,by="celltype_gene")vln.df$mean=ifelse(vln.df$mean > 3, 3, vln.df$mean)#这里的阈值3要提前综合所有基因看一下vln.df%>%ggplot(aes(celltype,exp))+geom_violin(aes(fill=mean),scale = "width")+ facet_grid(vln.df$gene~.,scales = "free_y")+ scale_fill_gradient(limits=c(0,3),low = "lightgrey",high = "yellow")+ scale_x_discrete("")+scale_y_continuous("",expand = c(0.02,0))+ theme_bw()+ theme( panel.grid.major = element_blank(),panel.grid.minor = element_blank(), axis.text.x.bottom = element_text(angle = 45,hjust = 1,vjust = 1) )ggsave("vln3.pdf",width = 11,height = 22,units = "cm")
4. 气泡图展示marker基因
Seurat的画法是这样的,
DotPlot(mye.seu, features = markerdf2$gene)+RotatedAxis()+ scale_x_discrete("")+scale_y_discrete("")#其余的微调同ggplot2
第二种方法,ggplot2代码如下
bubble.df=as.matrix(mye.seu[["RNA"]]@data[markerdf2$gene,])bubble.df=t(bubble.df)bubble.df=as.data.frame(scale(bubble.df))bubble.df$CB=rownames(bubble.df)bubble.df=merge(bubble.df,mye.seu@meta.data[,c("CB","celltype")],by = "CB")bubble.df$CB=NULLcelltype_v=c()gene_v=c()mean_v=c()ratio_v=c()for (i in unique(bubble.df$celltype)) { bubble.df_small=bubble.df%>%filter(celltype==i) for (j in markerdf2$gene) { exp_mean=mean(bubble.df_small[,j]) exp_ratio=sum(bubble.df_small[,j] > min(bubble.df_small[,j])) / length(bubble.df_small[,j]) celltype_v=append(celltype_v,i) gene_v=append(gene_v,j) mean_v=append(mean_v,exp_mean) ratio_v=append(ratio_v,exp_ratio) }}plotdf=data.frame( celltype=celltype_v, gene=gene_v, exp=mean_v, ratio=ratio_v)plotdf$celltype=factor(plotdf$celltype,levels = sort(unique(plotdf$celltype)))plotdf$gene=factor(plotdf$gene,levels = rev(as.character(markerdf2$gene)))plotdf$exp=ifelse(plotdf$exp>3,3,plotdf$exp)plotdf%>%ggplot(aes(x=celltype,y=gene,size=ratio,color=exp))+geom_point()+ scale_x_discrete("")+scale_y_discrete("")+ scale_color_gradientn(colours = rev(c("#FFD92F","#FEE391",brewer.pal(11, "Spectral")[7:11])))+ scale_size_continuous(limits = c(0,1))+theme_bw()+ theme( axis.text.x.bottom = element_text(hjust = 1, vjust = 1, angle = 45) )ggsave(filename = "bubble2.pdf",width = 9,height = 12,units = c("cm"))
ggarrange(p1, p2, p3, p4, ncol=2, nrow=2, common.legend = TRUE, legend="bottom")