相信大家对Y叔的clusterprofiler这个R包并不陌生,一般做基因富集分析的时候都会用到这个R包。这个包非常实用,并且画出来的图也很不错。
其实小编前面已经花了不少篇幅给大家介绍过如何使用这个R包做GO富集分析和结果可视化,以及如何将富集结果中的gene ID转成基因名字
还有计算富集倍数的三种方法
☞GO和KEGG富集倍数(Fold Enrichment)如何计算
对于没有太多基础的小伙伴,小编还特地录制了视频进行了详细的讲解
当然使用clusterprofiler这个R包也可以进行KEGG富集分析
当然小编也将以上所有内容整理成了一个系统的线上课程
我们知道一般做富集分析,都需要有一个注释数据库。里面存放了对每个基因的注释信息,告诉我们这个基因属于那一条KEGG通过,参与到那些生物学过程(BP),有那些生物学功能(MF)以及属于哪一种细胞成分(CC)。一般我们对人这个物种中的基因做富集分析的时候,都会用到org.Hs.eg.db这个注释数据库,Hs代表的是human。小编也讨论过如何安装这个注释数据库。☞加载R包org.Hs.eg.db出错,避坑指南!
library(org.Hs.eg.db)
library(clusterProfiler)
ego <- enrichGO(gene = DEG,
OrgDb=org.Hs.eg.db,
ont = "all",
pAdjustMethod = "BH",
minGSSize = 10,
pvalueCutoff = 0.01,
qvalueCutoff = 0.01,
keyType='ENSEMBL')
那么问题来了,对于其他的物种,如小鼠,大鼠,线虫等等,其他物种的注释文件该如何获取呢?
可以从下面这个网页中查找,每一行代表一个物种的注释文件。
http://bioconductor.org/packages/release/BiocViews.html#___OrgDb
在做分析的时候我们只需要将代码中的org.Hs.eg.db更换成相应的物种的注释文件就可以了,例如我们换成小鼠的
library(org.Mm.eg.db)
library(clusterProfiler)
ego <- enrichGO(gene = DEG,
OrgDb=org.Mm.eg.db,
ont = "all",
pAdjustMethod = "BH",
minGSSize = 10,
pvalueCutoff = 0.01,
qvalueCutoff = 0.01,
keyType='ENSEMBL')
参考资料: