为了解决四个难题我们设计开发了“GSEA简易分析工具”和” GSEA结果可视化工具”
01—研究背景
Gene Set Enrichment Analysis (基因集富集分析)简称GSVA,由麻省理工学院和哈佛大学研究团队2005发表在Proc Natl Acad Sci U S A.提出来的一个基因功能富集方法,目前已经引用2万多次,可谓是做基因富集分析的常用工具[1]。同时GSEA官网在windows平台和MAC平台上也提供一个可视化的软件,只需点击鼠标即可完成。
虽然官方提供了图形界面的软件,但是作为新手,还会遇到以下几个问题:
1. 软件需要配置JAVA环境(初学者没有半天的时间搞定不了);
2. 纯英文界面,需要选择的参数较多(对于生信小白来说不够友好);
3. 电脑性能要求较高(笔记本电脑或配置低容易卡死);
4. 分析出来的结果不美观需要用R语言重新可视化(对初学者编程要求较高)。
考虑到上面的问题,我们在开发过程中整合之前项目的经验并结合上面的问题设计出两个小工具,小伙伴们只需要准备好数据,导入到小工具中就可完成一样的结果。
从分析到出图只需点击鼠标即可完成,中文友好界面了解一下
快跟着小编一起学习一下工具
网址导航
http://sangerbox.com/Tool 点击“GSEA简易分析工具”和” GSEA结果可视化工具”
02—使用方法
1、GSEA简易分析工具
----------
小工具默认支持三种类(样本分组,基因排秩,按基因分组)型的GSEA分析,三种模式的输入文件如下图所示。
1. 根据样本分组和基因表达谱进行GSEA分析,这种模式下需要输入两个文件,第一个文件为样本的表达矩阵,第二个文件为样本的分组文件,将分组文件按照分组进行排列,默认支持两组之间进行富集分析。
2. 根据表达谱某个基因的表达水平进行分组后再进行GSEA分析。
3. 根据特定基因的表达量进行排秩后进行GSEA分析,输入文件包含两列,第一列为基因名称,第二列为基因的表达量。
4. 输出结果,这里得出结果和GSVA软件得出的结果是一样的
5. 挑选结果:将分析结果下载到本地,用浏览器打开,根据自己的需求挑选感兴趣的通路进行可视化(前提是要先看懂GSVA软件的运行结果),如下图所示。
2、GSEA结果可视化工具
----------
1. 输入文件是上一步GSEA运行结果和需要可视化的通路,如下图所示。
2. 结果目录:默认在个人中心的GSEA_View_Result目录下,如下图所示。
点击添加图片描述(最多60个字)编辑
特别注意:
1.如果是以文件的格式将数据导入到云平台,平台默认无法读取Excel中的数据,必须将Excel文件转为以制表位符分割的文本文件,否则小工具将无法运行。
2.将文件从本地上传到网站上应注意文件名只能用字母、数字或下划线命名不能有空格等特殊字符命名,否则将上传失败。
参考文献
[1] Subramanian A, Tamayo P, Mootha VK, et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A. 2005;102(43):15545‐15550. doi:10.1073/pnas.0506580102