承接上一篇:采用生物信息学方法筛选和分析白癜风差异表达基因【1】
一、对象与方法
1.基因数据集分析:
从GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)中选择编号为GSE75819数据集。该数据来源于15例印度寻常型白癜风患者,包含白癜风皮损组织15例及非皮损皮肤组织15例(正常对照组)[2]。其中,男4例、女11例;1例年龄未提供,另14例年龄10 ~ 45(22.50 ± 2.20)岁;8例白癜风皮损组织来自小腿,3例来自前臂,来自膝盖、手腕、前额、颈部的皮损组织各1例,而15例非皮损组织均来自臀部。
(1)DEG的鉴定:首先对全部基因进行主成分分析,以压缩数据空间,将多元数据的特征在低维空间里直观地表示出来。利用R语言软件limma包(version 3.32.3)中LMFit和eBayes函数筛选上述白癜风皮损组织与非皮损组织间的DEG。当P < 0.05且|log2 | > 1.5时认为该基因为DEG。使用R软件ggplot2包(http://cran.r-project.org/web/packages/gplots/index.html)构建DEG的火山图和聚类分析图。
(2)DEG富集分析:通过基因本体论及京都基因和基因组数据库分析DEG的功能。
GO功能富集分析:利用R语言软件clusterProfiler对DEG进行GO功能富集分析,包含生物过程、细胞成分和分子功能3个方面。P < 0.05认为显著富集。
KEGG通路富集分析:应用Cytoscape软件插件BinGO对DEG进行KEGG通路分析。P < 0.05认为是显著富集的通路。
基因集富集分析:对DEG进行GSEA(http://www.broadinstitute.org/gsea)、基因集GO功能分析以及KEGG通路分析,以分析DEG显著涉及的基因功能和代谢途径。错误发现率< 25%的基因集被认为是显著富集的基因集。
(3)蛋白-蛋白相互作用分析:应用STRING数据库(https://string-db.org/)对白癜风皮损组织与非皮损组织间的DEG进行蛋白-蛋白相互作用分析,交互评分最低要求为0.7,鉴定与白癜风相关的中心基因。应用Cytoscape软件可视化蛋白-蛋白相互作用网络。
承接下一篇:采用生物信息学方法筛选和分析白癜风差异表达基因【3】