点击上方蓝字关注我们哦!
非肿瘤生信分析的两大拦路虎,一是没数据,二是临床信息不够。
自己没数据,公共数据集也没有,这样的情况就发不了论文了。
有数据的情况下,如果所提供的临床信息不足,那能分析的空间也有限。
难道,非肿瘤疾病的生信分析就没有未来吗?
当然有!
相同的研究套路从肿瘤领域迁移到非肿瘤领域,有时候可以实现降维打击,甚至可以发到更好的分数。
不管是肿瘤类生信,还是非肿瘤生信,重点都在于我们是否有个比别人更好的idea。只要idea好,高分不是问题。
快来看看不用临床数据也可以发高分的非肿瘤生信是如何进行布局的吧。
Title: Identification of Ferroptosis-Related Genes in Schizophrenia Based on Bioinformatic Analysis
标题: 基于生物信息学分析的精神分裂症铁死亡相关基因鉴定
期刊: Genes
此篇文献是
精神分裂症相关的非肿瘤疾病生信分析
。但不同于常规非肿瘤疾病的分析模式,该论文还结合了相关的
研究热点
进行分析,在对精神分裂症进行研究的同时引入了铁死亡。这也是非肿瘤疾病生信分析的巧妙构思之一哦,值得借鉴。
此篇文献
主要鉴定参与精神分裂症发生的铁死亡相关基因,
主要目的是想筛选出一批可能通过影响铁死亡过程进而影响精神分裂症进展的重要标志物。
那我们自己做研究的时候,就可以把该篇文献替换为其他的研究热点啦!
比如
精神分裂症结合细胞凋亡,阿尔茨海默症结合铁死亡,颅内动脉瘤结合糖代谢等等,这也是我们研究的创新性体现。可以看出,非肿瘤疾病也是可以衍生出很多的
分析思路
哒,并不是单一枯燥的呈现方式,而是需要我们有更多的
知识储备
。
>>铁死亡科普<<
铁死亡
是一种铁依赖性的,区别于细胞凋亡、细胞坏死、细胞自噬的新型细胞程序性死亡方式。
铁死亡发生的主要机制
是:在二价铁或酯氧合酶的作用下,催化细胞膜上高表达的不饱和脂肪酸发生脂质过氧化,从而诱导细胞死亡。虽然铁死亡最早是在癌细胞中被发现,但铁死亡已被证明在多种神经系统疾病中具有重要意义,如缺血性和出血性中风、阿尔茨海默病和帕金森病等。因此,作者推测
铁死亡相关基因也可能参与了精神分裂症的发病机制
。但尚未有关于铁死亡相关基因与精神分裂症相关性的研究,所以此篇文献中,作者探索了参与精神分裂症发生的铁死亡相关标志物。
>>
接下来一起看看作者是如何设计思路吧<<
Step.1
精神分裂症中与铁死亡相关的DEGs鉴定
▲图1. 精神分裂症患者和健康者之间的差异基因(DEGs)鉴定
作者首先利用GEO数据库中GSE27383数据集,筛选了精神分裂症患者和健康人之间,表达水平有显著差异的基因。
通过差异分析,共筛选出3338个差异基因,这些基因可能是导致精神分裂症发生的重要标志物。
▲图2. GSE27383的差异基因和铁死亡相关基因的韦恩分析
作者又从铁死亡相关数据库中获得了259个铁死亡相关基因。随后通过韦恩分析,筛选出3338个差异基因与259个铁死亡相关基因之间的公共基因有61个。
这61个基因既与精神分裂症的发生有关,又与铁死亡有关,因此视为最重要的基因,作为后续研究。
Step.2
GO分析和KEGG路径分析
▲图3. 铁死亡相关差异基因的重要GO分析条目
接下来,作者通过GO功能富集分析探索了61个基因的潜在作用,主要探索这61个基因主要定位在哪里、有什么样的分子功能、主要发挥什么样的生物学作用。
GO分析结果主要包含3大块:细胞组成(cellularcomponent,CC)、分子功能(molecularfunction,MF)、生物学作用(biologicalprocess,BP)。
CC、MF、BP这3个结果就可以分别解释基因定位在哪里、有什么样的分子功能、主要发挥什么样的生物学作用。这61个基因在这3个方面的功能阐述如图3所示。
▲图4. 铁死亡相关差异基因的重要KEGG通路
作者又通过KEGG功能富集分析,探索了这61个基因可能参与的潜在信号通路。参与通路的具体名称如图4。
GO和KEGG分析均为富集分析,都是对基因的功能进行注释,看看基因主要富集于哪些条目。但所有结果之间存在着潜在关联。
比如这篇文献中,作者发现基因会定位在细胞核(CC的结果),那定位于细胞核的话可能就会影响到后续基因的转录。
而MF的结果中有DNA结合、蛋白结合、RNA聚合酶活性这样的结果,那我们就可以猜测,可能是这些标志物在DNA层面有跟其它分子相绑定的各类结合位点,或者是发挥了RNA聚合酶的作用,而这些都与基因的转录水平密切相关。
进一步BP分析的结果中有转录调控这些条目,说明这些基因参与了转录调控的进程,同样证明了之前的推测。
可以看出,生信分析并不只是简单的结果呈现,结果与结果间会存在着潜在的关联。
深入剖析生信分析结果,就会发现生信分析真是个深不可测的“坑”,要求我们“全能”,并不只是做出某一个结果。
Step.3
PPI网络构建和关键基因筛选
▲图5. 用铁死亡相关差异基因构建PPI网络
作者进一步通过cytoscape软件,构建了61个基因的蛋白-蛋白互作网络(PPI),剖析了61个基因间的相互作用。
▲图6. 差异基因的PPI网络和10个hub基因
进一步,作者通过Cytohubba功能对整体PPI网络进行重要子网络筛选。并对重要子网络中的基因进行重要性排序,最终得出了10个最关键的hub基因。
图5及图6的目的都是在筛选关键基因,只是由多到少的逐层筛选。
Step.4
关键hub基因的验证
▲图7. TP53,VEGFA及PTGS2在脑部组织中的表达
随后,作者对筛选的10个关键hub基因进行了表达验证,证明其可能参与疾病的发生过程。
发现10个基因中只有3个基因在精神分裂症患者和健康人群中是差异表达的。
其中2个基因与健康对照组相比,在患者中的表达水平上调,1个基因下调。
▲图8. 三个基因分别在2个数据集中的诊断价值分析
进一步,作者通过ROC分析,分别在2个数据集中,评估这3个基因鉴别精神分裂症患者和健康人群的性能,也可视为预测精神分裂症的可能性。这是临床价值的进一步体现。
2个数据集均显示,TP53的预测能力较强。
▲图9. 标志物联合进行预后预测
作者又对3个指标进行联合分析,评估3个指标联合为一个综合指标时,去预测精神分裂症发生的能力。
结果显示,联合分析的预测性能有部分提升。
Step.5
Gene-miRNAs和Gene-TFs的调控网络
▲图10. 3个hub基因和miRNAs的相互作用
基于这3个基因在疾病发生中的重要潜在临床价值,作者进一步探索了调控这3个基因表达水平的上游miRNAs,并构建了这3个基因和所有miRNAs的调控网络。
结果发现,只有一个miRNA(hsa-mir-16-5p)同时与这3个基因相关,作者认为这个miRNA可能是同时调控这3个基因的重要上游。
因此,未来的研究中可以对这个上游进行表达干预,从而影响其下游基因,进一步控制疾病进展。
▲图11. 3个hub基因和转录因子间的相互作用
作者最后探索了可能调控这3个基因表达水平的相关转录因子,并构建了这3个基因和所有转录因子的调控网络。
结果发现,有3个转录因子(PHF8、SAP30、KDM5B)同时与这3个基因相关,因此这3个转录因子可能是同时调控这3个基因表达水平的重要分子。
图10及图11都是潜在调控机制的深入研究,作者从miRNA及转录因子两个方向探索了可能影响基因表达水平的潜在调控关联,可为后续的基础研究提供思路。
生信分析所预测的机制都可进一步通过基础实验去验证,又可进一步提升研究的深度和科学性。
此篇非肿瘤疾病的生信分析,是疾病结合某一研究热点后进行了深层次分析。
先筛选了疾病相关标志物,再获得了疾病与铁死亡共同相关的基因,这群基因可能就是通过调控铁死亡过程而影响疾病进展的重要标志物。
▼
作者进一步对这些标志物进行逐层筛选,获得更为关键的标志物。
▼
再对关键标志物的疾病鉴别能力进行评估,升华其临床价值。
▼
最后预测了可能调控这些关键基因表达的调控因子,进一步提升研究的深度,也为后续基础实验验证提供思路。
以上为非肿瘤纯生信高分sci文章的完整思路及结果图解读,
>>本期学习福利<< 想要进一步学习的同学可以滴滴我