前言
一般我们挑出一堆感兴趣的基因想临时看看它们的功能,需要做个富集分析。虽然公司买了最新版的数据库,如KEGG,但在集群跑下来嫌麻烦。这时网页在线或者本地化工具派上用场了。
DAVID
DAVID地址
以前我会首选DAVID,原因是方便简单。有人说它数据库更新慢,不准确(据说被science点名批评了),也有人说它运行慢,数据库更新慢是硬伤,但我只是大概看下基因集的功能,总体结果不会差到哪里去。至于运行速度我反而觉得比其他工具更快。
使用方法:
注释结果有很多,挑自己感兴趣的数据库,我一般看GO和KEGG。
校正下超几何检验的Pvalue值,查看结果,结果都有链接,很方便查看。
但是DAVID没有可视化结果,临时看一看还行。
Metascape
Meatascape地址
Metascape是Cytoscape的一个插件,其数据更新快,覆盖面广泛。整合了GO、KEGG、UniProt和DrugBank等多个权威的数据库,使其不仅能完成通路富集和生物过程注释,还能做基因相关的蛋白质网络分析和涉及到的药物分析。
默认分析Express Analysis
针对小白,直接生成一个简单明了的报告,图文并茂,结果包括富集总括、基因列表、基因注释、富集分析、蛋白互作富集等。并且可以下载excel表,ppt和zip压缩文件。
网络图还可保存为CYS格式,后续放到cytoscape中进行编辑。
定制分析CustomAnalysis
Annotation可以根据自己的需要,选择感兴趣的,想在结果中体现的基因注释查看与基因注释 相关的文章")项目来进行勾选。勾选完成之后,点击左上角的Apply按钮运行。
Membership支持用户自行选择通路富集、生物过程富集、功能相关和产物分析等每一个注释步骤所用到的数据集,并可以在搜索框中输入感兴趣的字段,比如GO中的某一个或某几个term,或者一些功能性的描述,以便进行更有针对性地分析。
输入完成感兴趣的字段之后,点击左侧的Search按钮进行查找,之后点击左上方Apply生成这一步骤的结果。
Enrichment支持用户选择通路和功能富集过程中的各项指标,以及蛋白质互作网络形成过程中的各项指标。用户可以根据自己的需求,来设定显著性阈值,网络中包含元素的最大或最小值,以及分析步骤中想用到的数据集等参数。
生成报告
报告形式同上。
Enrichr
Enrichr地址
除了支持gene list,还支持bed文件,但支持的gene ID种类比较少。
Enrichr结果将多个数据库进行比较。除了常用的富集分析,还可展示表观修饰、转录因子结合以及疾病和不同细胞类型中的表达。
但是它展示结果比较单一,各个数据库结果差异也较大,个人不是很喜欢。
ClueGO
ClueGO也是Cytoscape的插件,在cytoscape中本地化安装使用,除了做功能富集外,主要是具有强大的绘图功能,目前被很多文章引用。
以上工具中,DAVID和Metascape甚至clusterProfiler等R包的结果我都只作为参考,真正做分析的时候还是需要用最新的数据库。当然,Metascape和ClueGO可作为后期绘图补充。