Prognosis-Related Molecular Subtypes and Immune Features Associated with Hepatocellular Carcinoma
与预后相关的分子亚型和与肝细胞癌相关的免疫特征
发表期刊:Cancers (Basel)
发表日期:2022 Nov 21
影响因子:6.575
DOI: 10.3390/cancers14225721
一、研究背景
原发性肝癌是全球癌症相关死亡的第四大原因,它表现出显著的组织学和生物学异质性。肝细胞癌(HCC)是最常见的类型,占原发性肝癌的90%以上。HCC的主要风险因素包括感染丙型肝炎或乙型肝炎病毒、过度饮酒、吸烟和饮食。遗传风险因素可能与这些环境风险因素相互作用,如CTNNB1(编码β-catenin)、TP53和AXINI基因的突变。
由于HCC的异质性很强,身体不同区域的肿瘤可能代表不同的亚型。这些亚型在代谢和信号通路上可能有所不同,导致患者生存期的差异。
二、材料与方法
1、数据来源
1)从广西医科大学附属肿瘤医院收集了六对HCC和配对的癌旁正常组织样本,这些样本是在不同的临床阶段被病理诊断为HCC的患者
2)从TCGA数据库中的肝癌(LIHC)数据集中下载了371个原发肿瘤样本、3个复发肿瘤样本和50个正常组织样本的基因表达谱
3)在GEO数据库,获得了GSE14520(225个HCC组织和220个非肿瘤组织)、GSE76427(52个相邻的非肿瘤组织和115个HCC组织)、GSE25097(268个HCC组织和243个邻近的非肿瘤组织)、GSE138178(49个HCC组织和配对的邻近非肿瘤组织)、GSE84006(38个原发性HCC组织和配对的邻近非肿瘤肝组织)、GSE136319数据集(秘鲁患者的47个肿瘤和47个非肿瘤肝脏组织的DNA甲基化数据)
2、分析流程
三、实验结果
01 - HCC中的DEGs及其功能富集度
为了确定与HCC预后相关的基因,作者首先利用TCGA、GSE76427、GSE25097和GSE14520数据集的数据进行了差异分析(图2A,B)。在四个数据集重叠的4036个交叉的DEGs中,有2058个上调,1272个下调,706个DEGs表达方向不同(图2C)。功能富集分析表明,激活了各种与HCC相关的途径,如P53信号通路、色氨酸代谢以及初级胆汁酸生物合成(图2D)。重叠的DEGs可能参与了细胞的氨基酸分解过程、羧酸分解过程和其他代谢过程(图2E)。
GSEA显示,DEGs与细胞周期、错配修复和DNA复制正相关,但与矿物质吸收、PPAR信号传导以及补体和凝血级联负相关。在GSE14520中,预测HCC患者5年OS的AUC是58%。Cox回归和KM分析也显示,3330个重叠的DEG中,有217个与HCC预后密切相关,而使用Metascape的进一步富集分析显示,这些预后基因在小分子分解代谢、小分子生物合成和有丝分裂细胞周期中明显富集。
为了评估TCGA和GSE14520中预后相关基因的诊断价值,作者计算了它们的AUC值,并从217个AUC>0.80的预后基因中选出138个(图3A)。然后对这138个基因进行单变量Cox分析,得到10个相对重要性大于0.2的生存相关基因(图3B)。随后的LASSO回归确定了七个特征基因:SORBS2, DHRS1, SLC16A2, RCL1, IGFALS, GNA14和FANCI,预测5年OS的AUC为0.744(图3C-E)。然后用GMM模型将7个特征基因的表达数据整合成3个群组127个组合,并选择AUC最高的群组来识别预测HCC复发的强势特征基因。经GMM分类器测定,127个组合中的1个特征基因的平均准确率为0.9901(图3F)。通过单变量Cox回归分析进一步调查特征基因的独立预后价值,表明FANCI在两个数据集中都与不良的OS显著相关(图3G,H),表明它可能作为HCC复发的一个新的预测生物标志物。
02 - 基于特征基因的预后风险评分作为HCC的预后工具
根据风险评分的中位数将HCC患者分为高风险组和低风险组(图4A,B),在GSE14520和TCGA数据中,其预测1、3、5年OS的AUC值均大于0.65(图4C,D)。使用整合了特征基因和临床病理风险因素的nomogram对OS预测进行了量化(图4E)。校准图也显示,nomogram与理想模型相比表现良好(图4F)。
为了确定HCC的分子亚型,根据217个预后相关基因对GSE14520和TCGA数据库的HCC样本进行了NMF聚类(图5A-C)。能够将HCC患者分为两个分子亚型(图5C):预后差的HCC的C1亚型,和OS良好的C2亚型(图5E)。还发现GSE14520的剪影宽度值为0.85(图5D),TCGA的剪影宽度值为0.88,这表明HCC样本与两个不同亚型之间有很好的相关性。
03 - HCC亚型对免疫疗法和化疗药物的敏感性
GSE14520和TCGA中两种HCC亚型的临床数据分布比较表明,两种亚型的年龄没有明显差异,但男性比女性更容易患两种亚型的疾病。此外,根据GSE14520(图6B)和TCGA(图6C)的数据,C1亚型显示出比C2亚型更短的生存期(图6A),以及对CTLA4-R治疗更大的反应性。相反,TCGA中的C2亚型对抗癌药物ZM.447439和AG.14699的反应性明显大于C1亚型(图6D)。
04 - 干性指数和FANCI的表达
根据干性指数值对HCC样本进行排名,显示其临床人口学特征与mRNAi明显相关(图S4A)。FANCI与干性指数正相关(图S4B),它在GSE138178和GSE84006数据集中都是上调的(图S4C,D)。利用Oncomine数据库进一步分析FANCI在各种癌症类型中的mRNA表达,发现FANCI在肝癌中与正常组织相比明显上调(图S4E)。这些结果被TCGA RNA测序数据在TIMER中证实,表明FANCI在肿瘤中的水平明显高于邻近的正常组织(图S4F)。
为了探索FANCI在HCC预后中的作用,作者进行了时间-ROC分析,结果显示,在GSE14520数据集中预测5年OS的AUC最高(图7A),而在TCGA中预测1、3、5年OS的AUC都大于0.60(图7B)。FANCI的AUC在所有四个数据集中都高于0.90(图7C)。富集分析显示,FANCI与纤维蛋白溶解的调节、环氧酶P450途径和蛋白激活级联呈正相关,而与错配修复、中心体分离和转体合成呈负相关(图7D)。此外,FANCI与细胞周期、DNA复制和蛋白酶体正相关,而与FOXO、IL-17和p53信号通路负相关(图7E)。
还发现在人类蛋白质图谱数据库中,FANCI在HCC组织中的表达高于对照组(图8A)。同样,6名HCC患者的转录组测序结果显示,与邻近患者相比,FANCI在HCC中高表达,特别是在肿瘤进展的患者2(RFS 66天)和5(RFS 248天)(图8B-D)。同时,FANCI在以前的研究中被确定为Wnt信号的下流基因,调节HCC的早期复发。这些结果提示,它可能正向调节范可尼贫血症的途径(图8E)。
05 - 免疫细胞浸润、体细胞突变和DNA甲基化
为了探索免疫细胞浸润在HCC中的潜在临床意义,作者确定了所有四个数据集的浸润水平(图9A)。与对照组相比,HCC样本中T辅助2型(Th2)、T辅助和前树突状细胞明显上调,而T细胞和细胞毒性细胞与C1亚型明显相关(图9B)。还分析了HCC组织中24种免疫细胞类型之间的相关性(图9C),并构建了四个集群,显示了彼此之间的正负相关(图9D)。此外,树突状细胞和Th12细胞与七个特征基因相关,而Th2细胞和FANCI之间有明显的相关性(图9E)。CIBERSORT算法还显示,大多数浸润的免疫细胞是T细胞(图9E)。
根据显示至少20倍覆盖率的测序数据,在364名HCC患者中鉴定了体细胞单核苷酸变异。发现突变使肿瘤抑制基因TP53(占所有患者的31%)、AXINI(8%)和RB1(5%)失活(图S5A)。此外,发现FANCI在HCC患者中有两个位点发生突变,这些突变可能会影响蛋白功能(图S5B)。进一步发现FANCI的mRNA水平与蛋白水平呈负相关,这意味着该基因会受到甲基化的影响(图S5D)。对GSE136319中秘鲁肝癌患者HCC和非肿瘤组织之间差异甲基化的基因分析表明,甲基化修饰被调查(图S5C)。此外,MEXPRESS工具显示,TCGA中FANCI启动子区域的甲基化水平在HCC样本中明显高于正常组织。
四、结论
作者利用生物信息学比较了肿瘤和非肿瘤组织之间的基因表达,以确定HCC分子亚型和生物标志物来帮助预测预后。此外,使用单样本基因集富集分析(ssGSEA)来确定免疫浸润的水平并描述肿瘤免疫微环境的特征。本研究确定了HCC患者的两种分子亚型,并检测了可能作为HCC潜在生物标志物和治疗目标的关键基因。