简介
今天要介绍的一款网页轻工具叫NetworkAnalyst,是一个表达谱数据综合可视化的工具。目前,该工具可对已选择基因的ID、不同数据集基因表达矩阵、 RNAseq 和 RNAseq fastq文件进行可视化分析。首先,咱们看下NetworkAnalyst发表的文章里面对该类轻工具的总结
优势一看自然就明白了,至于它能干嘛,每个按钮点一点,还提供示例数据,上手自然简单!官网首页,已经到第3个大版本了
基因ID的可视化
基因ID的可视化主要包括各种可视化分析( Assorted Visual Analytics )和网络可视化分析( Network Visual Analytics )两类。具体可视化内容如下图:
各种可视化分析
1.List Enrichment Network
可基于geneontology数据库和 Panther数据库进行GO分析,基于KEGG数据库进行通路富集分析。下图为一组差异表达基因KEGG分析的结果:
2.和弦图、韦恩图和热图的制作
一组基因数据做不了哈,需要多组数据,这里就不展示效果图了
网络可视化分析
1.蛋白相互作用网络(PPI)
(1)PPI网络
可基于 IMEx数据库和 STRING 数据库制作PPI网络
下图以一组差异表达基因基于IMEx数据库构建PPI网络为例:
2D:
3D:
(2)某个组织中的PPI网络
该功能基于 DifferentialNet 数据库,用于构建人输入基因在不同组织器官中的PPI网络。这个功能懂的人自然就知道比较牛逼了,特定组织的PPI网络,或许会有新的发现哟!
2.Gene Regulatory Networks (GRN)
主要包括三个可视化分析:gene-MiRNA调控网络,TF-gene调控网络和TF-MiRNA调控网络。
(1)gene-MiRNA调控网络基于 TarBase 和 miRTarBase数据库,用于构建基因与MiRNA的调控网络。
2D:
3D:
(2)TF-基因调控网络基于ENCODE数据库、JASPAR数据库 和 Enrichr数据库 制作的转录因子-基因调控网络。
ENCODE数据库从ENCODE ChIP-seq数据获得的转录因子和基因靶标数据。 仅适用于峰值强度信号<500和预测的调节电位得分<1(使用BETA减法算法)。
JASPAR数据库 通过TF结合位点配置文件数据库派生的JASPAR转录因子目标。
ChEA,即芯片富集分析,Enrichr数据库可通过整合文献精选的Chip-X数据推断得到。
(3)TF-MiRNA基于 RegNetwork 数据库制作转录因子调控网络 ,仅适用于人和小鼠。
构建输入基因中的转录因子与MiRNA相互调控网络。
2D:
3D:
3.Diseases, drugs & chemicals(疾病,药品和化学药品)
主要分为蛋白药物相互作用网络、蛋白化学物品相互作用网络和基因与疾病的联系
蛋白药物相互作用网络基于 DrugBankdatabase (Version 5.0)
蛋白化学物品相互作用网络基于 Comparative Toxicogenomics Database (CTD)
基因与疾病的联系 DisGeNET database
4.Gene Coexpression Networks
(1)组织特异性基因共表达网络基于 TCSBN database
下图为差异表达基因在脂肪组织中的共表达的网络:
(2)细胞特异性基因共表达网络基于 Immuno-Navigator database
下图展示了差异表达基因在CD4+T细胞中的共表达情况:
基于基因表达矩阵进行meta分析
对电脑的要求:①最新版本的Google Chrome或Mozilla Firefox;②至少15英寸显示屏,分辨率为1440 x 900或更高;③使用Intel Core i5 / i7或同等功能的至少2G可用内存。
合并的方法
基因表达矩阵的合并总共有4种方法:合并 P Values ,合并 Effect Sizes ,投票计算和直接合并。合并 P Values ,合并 Effect Sizes和投票计算主要适用于不同平台测得的基因表达矩阵,其中合并 P Values 和合并 **Effect Sizes **通过随机效应模型和固定效应模型合并。直接合并适用于同一平台测得的表达矩阵。
合并后的可视化方法如下图所示:
1.Network Visual Analytics
对选择的基因进行网络可视化分析,可选择提交数据集中的任何一个数据集的差异表达基因,也可选择通过meta分析合并后的差异表达基因。结果如前所述。
2.ORA Enrichment Network
ORA(Over-Representation Analysis)富集分析为 普通富集分析 ,同Network Visual Analytics 中的基因富集分析。通差异表达基因的富集分析。
3.**ORA Heatmap Clustering **
4. Venn Diagram
韦恩图可以做各个数据集与meta分析过表达基因的交集,点击某个区域即可显示交集的基因。
5.Chord Diagram
和弦图可有效显示少于1000个基因的关系,最大不超过2000个基因。
6. GSEA Enrichment Network
主要展示GSEA分析的结果。注意:这里需要修改合并方法中的P值,取得所有基因的表达矩阵。
7.GSEA Heatmap Clustering
可以展示某个功能集中基因的富集情况。下图展示了转录因子信号通路的基因富集情况。
8.合并后的PCA 3D
好了,今天的分享就到这里了哈,总结一下,这个轻工具非常好用,蛋白互作神器,图都是发表级的,还比STRING数据库的原始图高大上不少,更牛逼的是现在它还可以做各种分析,祝大家使用愉快哈!
作者:解琪琪;任恩惠
链接:https://www.jianshu.com/u/bcb81276c29d
来源:简书
参考文献:
- Zhou, G., Soufan, O., Ewald, J., Hancock, REW, Basu, N. and Xia, J. (2019) "NetworkAnalyst 3.0: a visual analytics platform for comprehensive gene expression profiling and meta-analysis" Nucleic Acids Research (doi:10.1093/nar/gkz240)
- Xia J, Gill E, and Hancock REW (2015) "NetworkAnalyst for Statistical, Visual and Network-based Approaches for Meta-analysis of Expression Data" Nature Protocols 10, 823–844
- Xia J, Benner MJ, and Hancock REW (2014) "NetworkAnalyst - integrative approaches for protein–protein interaction network analysis and visual exploration" Nucl. Acids Res. 42 (W1): W167-W174. (PPI data analysis and visualization)
- Xia, J., Lyle, N.H., Mayer, M., Pena, O.M. and Hancock, R.E.W. (2013) “INVEX - a web-based tool for integrative visualization of expression data”. Bioinformatics 29 (24), 3232-3234 (gene expression data analysis)
- Xia, J., Fjell, C.D., Mayer, M., Pena, O.M., Wishart, D.S. and Hancock, R.E.W. (2013) “INMEX - a web-based tool for integrative meta-analysis of expression data”. Nucleic Acids Research 41, W63-W70. (meta-analysis)
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。