文献:Prognostic Genes of Breast Cancer Identified by Gene Co-expression Network Analysis

文献时间

2018

摘要

这篇文章的目的是鉴别潜在的与乳腺癌发病相关的基因。使用WGCNA来建立加权共表达网络来探索临床特征和基因集之间的关系,以及来鉴定候选的生物标记基因。使用GSE1561数据集来进行分析,TCGA的数据来进行验证。通过平均连接层次聚类的方法鉴定了18个模块。显著性模块(R^2=0.48)中共发现48个网络节点基因。基于TCGA数据,5个节点基因(CCNB2, FBXO5, KIF4A, MCM10,TPX2)显示出不良预后。ROC曲线证实了这5个节点基因的表达水平对癌症组织有良好的诊断效果,这5个基因对应蛋白的表达水平在癌症组织中也显著高于正常组织。其中CCNB2, KIF4A, TPX2在癌症发展后进一步被上调。总结,发现了5个生物标记基因用于后续的研究。

引言

癌症的数据统计(显示出多么需要被研究)。治疗手段进步。不同类型不同治疗策略。

乳腺癌正的遗传因素。BRCA1和BRCA2是目前临床上用来评估遗传性乳腺癌风险性的生物标记基因。BRCA相关的乳腺癌具有相对明显的病理特征。超过20%的乳腺癌患者的BRCA基因都发生了突变。超过30%的乳腺癌患者的HER2的表达都被上调。先前的数据表明HER2的表达水平不仅有诊断价值,而且还影响治疗策略。拉帕替尼和曲妥珠单抗对于HER2上调的患者有显著的治疗效应。激素受体(ER/PR)的表达水平预示内分泌疗法的有效性,它们的上调普遍与良好的预后相关。Ki-67被报道和无病生存相关。CXCR4的高表达普遍与淋巴结转移和距离转移相关。尽管如次,乳腺癌治疗有效的基因标记物仍然很匮乏。因此,就需要更多关于这个的研究。

共表达分析能够构建无尺度基因共表达网络。WGCNA被广泛的用于分析大数据集,从中发现高度相关的基因模块。同时可以探索基因模块和临床形状之间的联系,从而鉴定候选生物标记基因。

材料和方法

数据处理

图1展示了分析流程。GSE1561数据集的来源,提供者,测序平台,数据内容。大多数患者都做了2次肿瘤活检,并对2例肿瘤的两次活检进行分析,以检验该技术的重复性。重复实验证明数据集中的生物影响远大于技术影响。免疫组织化学同样验证了这个数据集的高质量。通过R中的一个Bioconductor包,使用RMA算法对基因表达文件进行预处理。背景矫正后,经过背景校正、分位数标准化和探针汇总,进一步处理了包含12413个基因的数据集,并通过方差分析选出了前50%变异基因(6206个基因)进行WGCNA分析。

共表达网络构建

使用R中的WGCNA包对6206的基因进行建网。

临床显著相关模块的鉴定

通过计算模块基因和临床特征之间的相关性来锁定模块。定义GS为单个基因和目标性状相关系数的矫正p值。MS为一个模块内的所有基因GS的平均值,通过MS来鉴定相关性最高的模块。

GO和KEGG富集分析

工具使用的DAVID,进行GO和KEGG富集分析。

核心基因的鉴定和验证

模块内基因间高相关性(阈值0.8)的基因视为模块的核心基因,其中与的基因与形状之间的相关系数高(0.2)的视为最终基因。通过TCGA中的数据来验证这些核心基因。

结果

共表达网络的构建和关键模块的鉴定

通过皮尔森相关性系数建网。软阈值选取9(R^2 = 0.95)。通过平均连锁分层聚类,共识别出18个模块。其中blue模块和形状grade相关性最强,进一步进行分析。

GO和KEGG分析结果

BP上的富集结果有细胞分裂、DNA复制、姐妹染色单体结合、有丝分裂和DNA复制启动。MF上的富集结果有蛋白质结合、聚(a)RNA结合、RNA结合和ATP结合。CC上的富集结果有核质、细胞核、核仁、细胞质和细胞质。

KEG分析表明这些模块主要富集到了,细胞周期、DNA复制、剪接体、真核生物核糖体生物合成和RNA转运。这些结果表明这个模块中的基因主要涉及到细胞有丝分裂循环过程。

鉴定和验证核心基因

根据|MM| > 0.8 |GS| > 0.2(我觉的这里很有问题)阈值筛选规则,从模块中得到了42个候选核心基因。其中CCNB2,FBXO5,KIF4A,MCM10和TPX2折5个基因和生存分析曲线呈现负相关。而且,TCGA中的数据显示这5个基因在癌中的表达程度显著上升。其中CCNB2,KIF4A和TPX2在癌症晚期时被上调。ROC曲线显示CCNB2、FBXO5、KIF4A、MCM10和TPX2对正常组织和肿瘤组织显示出良好的诊断效率。而且,HPA数据库显示,这5个基因在肿瘤中的蛋白表达量也显著上升。既然这5个基因都是锁定模块中的核心基因,它们很可能有共表达的倾向。我们的共表达结果显示KIF4A和TPX2之间有很强的表达相关性。

讨论

乳腺癌对女性的威胁很大,而且治愈后复发的可能性极大。虽然治理手段不断的在进步,但是仍然很缺少精确的分子标靶。这项研究中我们使用了GEO中的表达数据来进行研究,使用TCGA中的测序数据和临床数据来进行验证。

筛选得到6306个差异性基因,进行WGCNA建网,得到18个基因模块。blue模块和性状grade显著相关,从中阈值筛选得到42个核心基因,生存曲线负相关的基因有5个分别是CCNB2,FBXO5,KIF4A,MCM10和TPX2。

5个基因的功能介绍,表达量描述(超长篇幅)!!!!!!!!!!!!

最后说一说WGCNA,之类的。。。。。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,457评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,837评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,696评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,183评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,057评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,105评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,520评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,211评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,482评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,574评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,353评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,897评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,489评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,683评论 2 335

推荐阅读更多精彩内容