GSEA
运行完以后默认出图较丑,而且只是png格式,不能改字体和大小,分辨率还是可怜的96dpi
,就像下面这个图,远看可以,近看不行,远达不到SCI要求。
但其实知道原理的话,就是各种Excel表而已,有再次画曲线的,有再次绘制的,当然也可以画成Y叔clusterprofiler
那样富集分析的柱状图和点状图,今天就介绍我最喜欢的点状图。
首先看表格内容,打开生成的文件夹,找到excel文件,主要是gsea_report_for_High_1574441392886.xls
和gsea_report_for_Low_1574441392886.xls
,具体文件名是看你自己定义的亚型和文件夹名,前缀是gsea_report_for_xx_yy
,xx
是亚型,yy
是文件夹名
比如你要分析其中的一个亚型,打开excel
表头显示如下
仔细分析,我们需要的部分为NAME
, SIZE
,NES
,NOM p-val
,FDR q-val
一般有统计学意义的定义是NES
>1或<-1及NOM p-val
<0.05及FDR q-val
<0.25,三者缺一不可,但是也可以只看p值或NES,看你需要什么样的结果,就保留什么结果,不然内容太多,也不好画图,我觉得10项就差不多了。
NAME
里面有很少下划线,影响后期作图,所以建议画图前先处理,把前缀如“KEGG_
”替换为空,把_
替换成空格,(是
空格
,不是空,不把_
后面替换为空格,后面无法改文本的长度),当然你可以把大小写改了,由于xls直接加载麻烦,所以建议保存为csv
格式,一般不建议txt
格式,因为csv
读表直接有表头,可以省一点代码。
下面开始表演
打开Rstudio,加载目标文件夹
setwd("/Users/mac/Desktop/1574441392886/L/KEGG.Gsea.1574441392886/L") #自己看目录
#读表
kegg<-read.csv("kegg.csv")
kegg=as.data.frame(kegg) #变矩阵,这行可以不执行
library(ggplot2) #加载神器
默认出图
p<-ggplot(kegg,aes(NES,NAME))+geom_point(aes(size=SIZE,color=NOM.p.val))
p
改颜色
#最少是红,最高是蓝,当然自己都可以改其他颜色,如绿色到紫色
p+scale_color_continuous(low='red' ,high='blue')
改背景
,最喜欢的bw
p+scale_color_continuous(low='red' ,high='blue')+theme_bw()
是不是觉得文本太长
了,缩短文本就可以了,比如我们想显示20个字母
一行
library(stringr) #加载这个
p+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))
是不是觉得点太小
了,当然可以增大点,比如由5号到10号
,记得不要贪大哦!
p+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
一般GSEA有两个亚型,能不能一起显示?
答案是当时可以,打开另一个表,把需要的内容复制到原来的表,最后一例加一列,定义为phenotype
即可,把自己定义的亚型填好,比如我的是High和Low,然后保存重新读一下表,重新画一下图,大于1为正,小于1为负。
kegg<-read.csv("kegg.csv")
p+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
当然也可以分面显示的
#分面显示一行
kegg<-read.csv("kegg.csv")
p+ facet_wrap(phenotype~.,scale="free")+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
也可以列分面
#分面显示一列
p+ facet_grid(phenotype~.,scale="free")+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
按照这个原理,如果做了多个分析,如GO,HALLMARK,reactome什么的,都可以往下添加,记得后面加一列分组,把内容加一下就好了,代码是一样的。
什么?不知道怎么导图?
ggsave("gsea.pdf",width=8,height=8)
宽和高自己慢慢调吧,图就在你的目录文件夹里
当然可以画柱状图,但是柱状图的信息要少一点,比如不能看size,而且图也比较丑,建议还是点状图。
ggplot(kegg,aes(NAME,NES,fill=NOM.p.val))+geom_bar(stat="identity")+coord_flip()+scale_fill_gradientn(colours=c("red","blue"))+scale_x_discrete(labels=function(x) str_wrap(x,width = 30))+theme_bw()