GEO和TCGA数据挖掘生物信息文章解读(宫颈癌) TCGA GEO

今天我们介绍一篇稍高分数的文章,来看一下生信挖掘文章如何发更高档次的杂志。这篇文章是利用GEO和TCGA数据挖掘宫颈癌预后相关的关键基因,2019年发表在Journal of Cellular Physiology 影响因子:4.52左右。

1.芯片数据差异基因及注释分析结果

作者在GEO数据库中找到宫颈癌相关的基因芯片数据:GSE63514,其中,包含28个宫颈癌样品和24个正常样本的基因芯片表达数据,通过差异分析共发现:1907个差异基因(944 up, 963 down)。作者利用火山图展示差异基因结果,其中差异最大的top200个基因绘制热图(如下图)。

2.差异基因蛋白互作网络分析PPI分析

将差异基因提交到STRING蛋白互作数据库,构建基因互作网络,利用cytoscape软件中的MCODE插件筛选出三个关键子网络。把这些子网络中的基因进行GO注释;

3.针对差异基因构建共表达网络

利用R语言中的WGCNA包,根据差异基因的表达量信息构建共表达网络,作者获得了4个共表达模块,其中蓝色模块与宫颈癌正相关,棕色模块与宫颈癌负相关(下图c),因此作者在这两个模块中挑选hub 基因用于后续分析。

4. 从hub基因中筛选预后相关基因

通过WGCNA共表达网络分析,作者共挑选出116个关键hub基因。然后,利用TCGA中宫颈癌表达数据以及临床数据,通过生存分析挖掘与预后相关的关键基因。具体方法是用Cox多因素回归分析筛选与疾病显著相关的基因,最终发现SCNN1B, ANLN, APOC1, CNTLN, and TEX30 五个基因具有显著的预后相关性,并构建预后风险模型:

过风险模型可将病人分成高风险和低风险两组,生存分析发现两组具有明显的差异(下图a)。然后针对模型的准确性进行评估,ROC曲线中AUC值达到0.719,说明这个预测模型在5年生存期内预后表现非常好。

5.甲基化数据筛选EPHX2和RMI2

作者再次对前面分析出的hub基因进行分析,利用GEPIA database 数据库筛选出与生存率相关的候选基因, 作者发现基因RMI2和EPHX2在患者中表达量越高患者生存时间会越长,进一步在TCGA数据中的甲基化芯片数据分析发现,这两个基因的表达量与甲基化的水平负相关,生存分析结果表明RMI2基因的高甲基化患者组与低甲基化组生存率生存期存在显著不同(下图cd),但是,EPHX2的甲基化水平与生存率不相关。

为进一步说明这两个基因与宫颈的预后相关,作者又在两个数据库(FireBrowse and ONCOMINE)中查看他们在正常组织和癌组织中的表达量发现:EPHX2和RMI2在绝大多数癌症当中都表现为低表达;从而证明了这个两个基因如果高表达有益于患者的生存期延长。

总结:

作者能发相对较高分数的文章,与其使用的数据库较多有关系,多个数据相互验证,更加说明自己结果的准确性。使用到的公开数据库包括:GEO数据,TCGA表达数据,TCGA甲基化数据,GEPIA database,以及FireBrowse and ONCOMINE数据库。分析流程总结如下:

参考文献:https://www.ncbi.nlm.nih.gov/pubmed/31041817

延申阅读

GEO芯片数据下载 |GEO数据与WGCNA--挖掘胶质瘤共表达网络的关键模块与通路|GEO和TCGA套路文章解说|基因芯片表达差异分析|GSEA法基因功能富集分析原理详解!|挖别人的数据,发自己的文章|TCGA-数据挖掘|转录因子研究方法!GEO芯片数据挖掘(直肠癌)

更多技能学习链接:

http://m.study.163.com/provider/400000000234009/index.htm?share=1&shareId=1031484705

更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘转录组文献解读

5.微生物16S/ITS/18S分析原理及结果解读OTU网络图绘制cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课,学习链接:linux系统使用perl入门到精通perl语言高级R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析GEO芯片数据挖掘GSEA富集分析课程TCGA临床数据生存分析TCGA-转录因子分析TCGA-ceRNA调控网络分析

8.其他课程链接:二代测序转录组数据自主分析NCBI数据上传二代测序数据解读

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,214评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,307评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,543评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,221评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,224评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,007评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,313评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,956评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,441评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,925评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,018评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,685评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,234评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,240评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,464评论 1 261
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,467评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,762评论 2 345

推荐阅读更多精彩内容