今天和大家分享的是2020年4月发表在JOURNAL OF CELLULAR BIOCHEMISTRY(IF:4.237)杂志上的一篇文章《CFHR3 is a potential novel biomarker for hepatocellular carcinoma》,作者为了深入研究补体因子H相关蛋白CFHR3在肝癌中的作用,对TCGA来源以及ICGC来源的肝细胞癌RNA-seq数据和临床数据进行了全面生物信息学分析,明确了CFHR3在肝癌中的预后价值。
前言
肝细胞癌(HCC)是世界第五大最常见的恶性肿瘤,每年全球诊断出超过700,000例新病例。HCC是一种异质性疾病,通常起源于肝硬化,在亚洲和非洲与乙型肝炎病毒(HBV)感染有关。外科手术的发展显著提高了早期HCC患者的生存率,但是由于HCC病情进展快速,大部分患者被诊出时就已经是晚期,并且只有不到30%的诊出患者接受外科手术,总体生存率还是很低。因此,很有必要挖掘更多有利于改善治疗的新靶标。
由于缺乏对疾病机制的全面了解,HCC治疗方法的研究进展缓慢。补体系统是先天免疫的关键组成部分,可以促进或抑制肿瘤发生。补体因子H家族包括H因子(FH),补体因子H样蛋白(CFHL1)和补体因子H相关蛋白1-5(CFHR1-CFHR5)。CFHR3也称为DOWN16和FHR-3,是一种补体系统激活的负向调节剂,在先天免疫中起着重要作用。先前的研究表明CFHR3与许多免疫系统疾病之间存在联系,例如非典型溶血尿毒综合征,黄斑变性,IgA肾病和系统性红斑狼疮。但是,迄今为止,CFHR3在肝癌中的作用尚不清楚。
材料与方法
1、患者数据
作者从TCGA和ICGC数据库中下载HCC患者的临床数据以及RNA-seq表达数据,剔除了部分临床病理数据不足或基因表达值为“ 0”的患者数据。
2、统计分析
作者使用R(v.3.6.0)软件进行统计分析。利用Wilcoxon秩和检验分析HCC队列中正常组织和肿瘤之间CFHR3表达水平的差异。使用Kolmogorov-Smirnov检验和逻辑回归分析CFHR3表达与临床病理特征之间的关系。
3、生存分析
生存分析计算TCGA和ICGC队列的总体生存(OS),并使用Kaplan-Meier生存曲线衡量判断准确性。还使用单因素和多因素Cox回归比较CFHR3和其他临床特征的预后价值。CFHR3表达的临界值由所有组的中值确定。使用R软件包“ survivalROC”,确定ROC曲线,曲线下面积(AUC)和C指数,以评估基因对整体生存的预测价值。
4、ESTIMATE算法
使用R包“ESTIMATE” 计算每个队列的ESTIMATE分数,然后将患者根据ESTIMATE分数中位数分为高或低两组。
5、基因集富集分析
利用GSEA2‐2.2.3以及MSigDB v6.2进行,基于默认的富集参数,每次分析重复1000次,选取FDR< 0.25 且family‐wise error rate <0.05的基因集。
结果
1、临床病理特征
表1列出了TCGA和ICGC数据库中患者的临床特征。TCGA患者的59%(n = 377)和ICGC患者的41%(n = 260)均分为I,II,III和IV期。TCGA队列中有255名男性,ICGC中有192名男性。在TCGA队列中,患有I,II,III和IV期的患者人数分别为175、87、86和5,在ICGC队列中分别为40、117、80和23。
2、肝癌中CFHR3表达水平
为了评估TCGA和ICGC队列中HCC患者CFHR3的表达水平,作者进行了Wilcoxon秩和检验(图1)。发现TCGA队列中肿瘤组织中的CFHR3表达水平远低于正常组织(P <.001;图1A),同时肿瘤组织中CFHR3的表达水平显著低于癌旁组织(P <.001;图1B)。ICGC队列的结果与TCGA结果一致,即肿瘤组织中CFHR3的表达水平低于正常组织(P <0.001;图1C)。
作者接下来比较了两个队列中低分期(I&II期)和高分期(III&IV期)肝癌患者的CFHR3表达水平(图2)。
逻辑回归单变量分析显示,CFHR3高表达表现出良好的预后特征(表2)。TCGA队列中高CFHR3表达与以下特征显著相关,如高分期(I vs III: OR = 0.6,P = 0.0001),等级(G1 vs G3:OR = 0.68,P = .003),等级(G1 vs G4:OR =0. 68,P = 0.218),T分类(T1 vs T2: OR = 0.64,P = 0.0825),T分类(T1 vs T3: OR = 0.64,P = 0.0001)。在TCGA队列中,IV期只有5例患者,并且I期和IV期之间没有显著差异(I vs IV,OR = 1.21,P =0 .0183)。结果表明,CFHR3低表达的HCC可能比CFHR3高表达的HCC预后更差。
3、CFHR3表达量作为HCC预后的价值
作者通过Kaplan–Meier曲线分析了不同分期和CFHR3不同表达量的生存率差异。结果显示,在TCGA(P <0.0001;图3A)和ICGC(P <0.0001;图3D)中,CFHR3低表达的患者的生存率低于CFHR3高表达的患者。此外,在TCGA的I和II期(P <0.034;图3B)和ICGC(P =0.002;图3E)队列中,发现CFHR3高表达的患者的生存率高于CFHR3低表达的患者。CFHR3高表达的患者在TCGA队列的第三和第四阶段(P = 0.013;图3C)和ICGC队列的第三和第四阶段(P = 0.056;图3F),存活率更高。单变量分析还证实了CFHR3作为预后生物标志物的可能性。如表3所示,CFHR3在TCGA(P = 0.0007)和ICGC(P = 0.001)队列中具有预后意义。与低表达患者相比,CFHR3高表达的HCC患者有更好的预后(表2)。多元分析与这些结果一致(图4)。
4、CFHR3作为HCC生物标志物的有效性研究
为了评估CFHR3作为HCC生物标志物的有效性,作者进一步了TCGA和ICGC队列的ROC曲线中的Uno C指数和AUC值(图5A和5B)。在亚组分析中,CFHR3在两个独立队列的所有I期,II期以及III期和IV期患者中均具有稳定的AUC值(TCGA:0.66、0.63、0.62和ICGC:0.66、0.73、0.63;图5A,5B)。在TCGA和ICGC队列中时间相关的AUC值显示出一致的模式(图5C和5D)。
为了比较AUC和C指数,作者分析了其他预后基因,包括SAC3D1,AP2M1,MKI67和GPC3。利用ROC曲线评估TCGA和ICGC队列中这些基因的预后能力(图6A-J)。TCGA队列中SAC3D1和MKI67在2年和3年内的AUC值均大于CFHR3的AUC值。但是在CFGA3的TCGA队列中,0.5年和5年的AUC值优于其他基因的AUC值。在ICGC队列中,CFHR3与其他基因相比显示出更高的AUC值。此外,与其他已建立的预后基因表达相比,CFHR3在TCGC和ICGC队列中显示出更高的C指数值(表4)。总之,CFHR3在肝癌患者中表现出良好的分类准确性和预测能力。
5、ESTIMATE分析
为了探究高风险和低风险HCC人群在ESTIMATE,免疫和基质评分方面的差异,作者分析了TCGA和ICGC人群中CFHR3的差异表达。结果表明,低危人群的ESTIMATE值,免疫和基质评分均高于高危人群(P <0.01)(图7A和7B)。
6、CFHR3与生物学通路和功能之间的关系
作者利用GSEA分析TCGA数据集,以明确CFHR3低表达和高表达之间的功能和生物学通路。分析表明,CFHR3低表达表型由许多关键通路组成,并与肿瘤发生有关。高风险组中富集了所有通路,包括细胞周期,Wnt信号通路,结肠直肠癌,癌症通路,Notch信号通路,VEGF信号通路和P53信号通路。另外,CFHR3高表达组还发现了补体和凝血级联以及初级胆汁酸的生物合成这两个通路的富集(图8和表5)。
总结
本篇文章的作为单基因生信分析文章,主要的思路是首先利用Wilcoxon秩和检验分析了TCGA以及ICGC队列中癌组织和正常组织、癌旁组织之间CFHR3的表达差异,然后利用Kaplan‐Meier生存曲线比较两个队列中HCC高低分期之间CFHR3的表达差异,利用单变量分析进一步明确CFHR3的表达差异与临床预后特征之间的相关性,这时确定了CFHR3低表达显示较差的预后。接下来,通过Kaplan–Meier生存曲线分析了不同分期和CFHR3不同表达量的生存率差异,验证CFHR3的预后价值。同时,利用ROC生存分析检验CFHR3预测的有效性。最后利用ESTIMATE分析和GSEA富集分析展示了CFHR3高表达和低表达之间免疫和基质评分方面的差异以及富集通路的差异。
该文章可谓完美复现单基因分析的思(tao)路,就是表达特征+预后价值+免疫浸润,然后再加点功能相关的分析,然后4分+文章就到手啦,是不是很心动,如果你也有感兴趣的肿瘤和基因想要进行类似的研究,快来联系我们吧。