在线富集分析DAVID
上传基因
- 点击Start Analysis,打开操作界面
- 在左侧的输入框中输入要进行富集分析的基因,或选择文件上传(上传的文件是一个文本文件,可以有多列,列与列之间通过制表符分割。但是第一行必须注明这一列的标识符类型)
- 在Select Identifier下拉框中选择上传的基因的标识符的类型(如果上传多列的文件,文件的表头就是填的这个下拉框里的内容。此时Select Identifier下拉框的内容就是文件中作为基因标识符的那一列的名字。如果上传的是基因的名称,就选择OFFICIAL_GENE_SYMBOL)
- 在Select species中选择一种物种(拉丁名,如Homo sapiens,只要输入部分单词就会自动补全)
- 选择上传的标识符的类型,因为我们是进行富集分析,所以选择Gene List
- 点击Submit List按钮提交
定制分析结果
- 点击提交后会跳出一个新的界面。在左侧可以对上传的基因进行筛选。
- 如果没有显示Annotation Summary Results,可以点击Shotcut to DAVID Tools-Functional Annotation,这样就会显示Annotation Summary Results
- 有时候上传的基因可能归属于不同物种,或是有些基因的物种信息无法识别,这是可以选中某一物种,点击Select Species进行限定
下载GO富集分析结果
- 点击Gene_Ontology可以显示GO富集分析的结果(默认选中DIRECT类型的GO term。DIRECT说明该GO term是通过实验确定的)。点击Chart可以显示详细的富集结果。
- 点击Options可以对富集结果作进一步限定:Count代表某一GO term上富集的基因的最小数量,Display中可以勾选校正P的方法,Number of records为计算完成后一页显示多少基因。完成设置后点击Rerun Using Options可以根据上述条件对结果进行筛选。
- 点击Download File可以下载富集的结果(我的浏览器是直接显示文件的内容的,需要手动下载)
- 通过这种方法可以将GO富集分析的BP、CC、MF都下载到本地,后续可以进行进一步的筛选和可视化
下载KEGG富集分析结果
- 点击Pathways,可以找到KEGG_PATHWAY这样一栏。点击Chart显示详细的富集结果。
- 像之前GO富集分析一样,这里也可以对结果作进一步限定
- 点击Download File下载文件
数据可视化
视频教程里是使用Excel进行的数据可视化,但是Excel的自动转换可能会在不知情的情况下把数据修改掉(比如SEPT9这个基因就可能会被Excel转换成9月9日)。所以我还是选择用R来绘图
setwd("")
library("ggplot2")
dat = read.table("GO.txt", sep='\t', header=T)
#按数量排序
dat = dat[order(dat$Count,decreasing=T),]
#筛选出P<0.05的GO term
dat = dat[which(dat$PValue < 0.05),]
#只选择前20
show = dat[1:20,]
#绘图
ggplot(show, aes(x=Term,y=Count,fill=PValue)) + geom_bar(stat="identity") + coord_flip() + scale_fill_gradient(low = "red", high = "green") + scale_x_discrete(limits=show$Term[20:1])
#ggsave("fig.png")