基因集富集分析GSEA(gene-set enrichment analysis)。这个操作并不难,主要就是准备符合GSEA要求的数据文件(本地的话4个),关于文件准备,可细见官方说明。若有时间我稍后整理以前资料,单独成一篇GSEA数据文件准备。最主要的还是GSEA结果解读。
另外,GSEA我们可能更多的用的是它的富集功能,而实际上它还有其他非常好用的功能,看自己怎么活学活用了,具体来说,就我用的多的有以下几个:(欢迎大家补充)
- 1 当然是最常用的基因集富集分析,这个不用多加解释
- 2 如果你自己有N个gene在不同样本或不同时间点的表达值,你想知道和其中某个你感兴趣的gene的表达模式一致(也就是共表达)的有哪些gene,并且这些gene富集在哪条信号通路,GO,染色体,受哪个miRNA调控等的话,可以用GSEA实现,并且通过cytoscape可以画出图
- 3 有没有哪个(些)genes在富集到的GO或kegg里出现次数最多(意味它可能很关键,连接很多信号通路或生理过程等),这个功能通过leading edge analysis实现。
- 4 相对复杂一点的,按照GSEA要求的格式,做自己的GO或KEGG文件(异想天开的比如:你发现了一个新的信号通路,或作用机制,你可以把这些gene做成自己命名的信号通路,然后把你证明这个信号通路存在的数据在这个信号通路去富集。)(另外,你也可以自己重新优化适合自己的GO:BP或KEGG),这样就像是自己的百科全书。
- 5 通过4,有没有发现,自己可以天马行空的制作自己觉得好玩的非生物学的小玩件。。。。