第25周-2433个乳腺癌患者的173个基因的突变全景图

2433个乳腺癌患者的173个基因的突变全景图

发表于2016年的NC,The somatic mutation profiles of 2,433 breast cancers refine their genomic and transcriptomic landscapes 可以说后续做乳腺癌人群队列突变研究的都需要引用这篇文章的数据结果,里面涉及到的分析要点也比较多,都是比较容易重现的。

这2433个病人,来自于 METABRIC 计划,已经有

  • copy number aberration (CNA)
  • gene expression
  • long-term clinical follow-up

的信息,所以这个时候再加入173个基因的捕获测序,可以更加全面的了解乳腺癌患者。

乳腺癌具有患者间与同一患者肿瘤内的基因组变异性。以患者间的异源性分类早期乳腺癌生物亚型,现在临床对乳腺癌患者通常是观察 morphological assessment (size, grade, lymph node status) ,或者检查,ER,PR,HER2 等marker,目前的亚型主要是以下:

  • 管腔A型(luminal A)
  • 管腔B型(luminal B)
  • 类正常乳腺型(normal breast-like)
  • HER-2型
  • 基底细胞样(basal-like)乳腺癌。

Pereiral等通过测序2433例乳腺癌样本的173个基因,发现40个肿瘤抑制基因和癌基因的驱动基因(多重驱动),这些基因参与的生物学过程包括:

  • AKT信号
  • 细胞周期调节
  • 染色质功能
  • DNA损伤与凋亡
  • MAPK信号
  • 组织架构
  • 转录调节
  • 泛素化

并且发现ER+乳腺癌患者PI3K突变与不同的生存相关。

实验前挑选基因

挑选的173个基因,来自于前面的TCGA计划,下面简单列出几个基因:

#Supplementary Dataset 1 - Details of genes & mutations in this study
#Genes names, positions and annotation transcripts, numbers of various classs of mutations, numbers of CNAs, numbers of samples with double mutations, whether gene was included because of homozygous deletions

完整表格见: Supplementary Data 1

HGNC_symbol Chr Start End Strand Annotation_transcript Number_mutations Number_synonymous Number_missense
ACVRL1 12 52300702 52317645 + ENST00000388922 72 7 12
AFF2 X 147581639 148082693 + ENST00000370460 296 28 40
AGMO 7 15239443 15602140 - ENST00000342526 117 11 24
AGTR2 X 115301458 115306725 + ENST00000371906 40 0 14
AHNAK 11 62200516 62314832 - ENST00000378024 387 82 237
AHNAK2 14 105403091 105445194 - ENST00000333244 878 322 524
AKAP9 7 91569689 91740487 + ENST00000356239 265 30 137
AKT1 14 105235187 105262580 - ENST00000554581 193 17 96
AKT2 19 40735724 40791765 - ENST00000392038 138 10 12
ALK 2 29415140 30144932 - ENST00000389048 188 37 49
APC 5 112042702 112182436 + ENST00000457016 159 18 55
ARID1A 1 27022022 27109101 + ENST00000324856 243 39 57
ARID1B 6 157098564 157532413 + ENST00000346085 204 40 54
ARID2 12 46123120 46302319 + ENST00000334344 159 29 36
ARID5B 10 63660513 63857207 + ENST00000279873 143 18 39
ASXL1 20 30945647 31027622 + ENST00000375687 142 21 50
ASXL2 2 25961753 26101812 - ENST00000435504 128 13 42

somatic突变结果

大部分的分析资料都是在: Supplementary Information

纯粹分析结果在 : Somatic mutation calls and ASCAT segment files for 2,433 primary tumours are available at http://github.com/cclab-brca

但是原始数据是 EGAS00001001753 需要申请才能下载。

突变仍然是以 PIK3CA (coding mutations in 40.1% of the samples) and TP53 (35.4%) 为主。

其次就只有5个基因突变超过10%的样本了,分别是:MUC16 (16.8%); AHNAK2 (16.2%); SYNE1 (12.0%); KMT2C (also known as MLL3; 11.4%) and GATA3 (11.1%) ,但是MUC16 本身的背景噪音太大,不适合二代测序这个技术。**

病理性的germline突变情况

还是那些出名的基因作者就拿出来说了说:

  • BRCA1 and BRCA2 were identified in 1.36% and 1.64% of the cohort, respectively
  • 2.22% of tumours harboured pathogenic CHEK2germline mutations.
  • TP53 pathogenic germline mutations were found in 0.82% of the tumours.

突变过滤策略

值得注意的是: All reads with a mapping quality < 70 were removed prior to calling.

其它策略包括:

  • Based on our analysis of replicates, SNVs with MuTect quality scores <6.95 were removed.
  • We removed those variants that overlapped with repetitive regions
  • Fisher’s exact test was used to identify variants exhibiting read direction bias
  • SNVs present at VAFs smaller than 0.1 or at loci covered by fewer than 10 reads were removed, unless they were also present and confirmed somatic in the Catalogue of Somatic Mutations in Cancer (COSMIC).
  • 删除那些在千人基因组计划的任意人群(AMR, ASN, AFR) 里面频率大于1%的变异位点。
  • We used the normal samples in our data set (normal pool) to control for both sequencing noise and germline variants, and removed any SNV observed in the normal pool (at a VAF of at least 0.1).

这些策略理论上是需要引入到自己的研究里面的。

找driver突变

使用的是: Vogelstein et al.16 的方法 , 定位了 40个基因 , We used a ratiometric method to identify 40 Mut-driver genes

主要是区分recurrent和inactivating的突变

其中recurrent突变包括

  • nonsynonymous SNVs
  • in-frame indels
  • oncogene score (ONC)

而inactivating突变包括:

  • frameshift indels
  • nonsense SNVs
  • splice site mutations
  • tumour suppressor gene score (TSG)

The mutation patterns of some Mut-driver genes differed by ER status.

值得注意的是:

  • Overall, 22.6% of tumours harboured a coding mutation in one of the seven Mut-driver genes involved in chromatin function (KMT2C, ARID1A, NCOR1, CTCF, KDM6A, PRBM1 and TBL1XR1).
  • Of the 40 genes, 8 were independently identified as Mut-driver tumour suppressor genes using the ratiometric method described above: FOXO3, CTNNA1, FOXP1, MEN1, CHEK2 in ER+ tumours; CDKN2A, KDM6A and MLLT4 in both ER+ and ER− tumours.

探索不同突变直接的关系,互斥或者共发生

首先是somatic的SNVs的 关系,如下图:

[图片上传失败...(image-b43f90-1542717772571)]

只要有了这些突变信息,比如maf格式的somatic mutations就可以用现成的R包,比如maftools来做上图。

然后是somatic的CNVs的关系,如下图

[图片上传失败...(image-38a60b-1542717772571)]

这个要稍微复杂一点,把拷贝数变异和点突变信息来互相联系。

根据 IntClusts 分类来看突变情况

前面的分析,都是根据ER表达情况来对两千多个乳腺癌患者进行分类,现在是通过作者前面发表的 IntClusts 分类来检查突变情况,下面的这个突变全景图是整个文章的精髓:

image

根据 mutant-allele tumour heterogeneity (MATH) 来探索肿瘤异质性

结论很清晰:

  • ER+ tumours generally had lower MATH scores (median=0.29, IQR=0.18–0.44) than ER− tumours (median=0.41, IQR=0.25–0.56).
  • Higher MATH scores were associated with worse outcome in ER+ cancers

这个分析也是被 maftools 包装起来了,很容易在自己的数据里面复现这个分析点。

(文章转自jimmy的2018年阅读文献笔记)

生信基础知识大全系列:生信基础知识100讲
史上最强的生信自学环境准备课来啦!! 7次改版,11节课程,14K的讲稿,30个夜晚打磨,100页PPT的课程。
如果需要组装自己的服务器;代办生物信息学服务器
如果需要帮忙下载海外数据(GEO/TCGA/GTEx等等),点我?
如果需要线下辅导及培训,看招学徒
如果需要个人电脑:个人计算机推荐
如果需要置办生物信息学书籍,看:生信人必备书单
如果需要实习岗位:实习职位发布
如果需要售后:点我
如果需要入门资料大全:点我

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,898评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,401评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,058评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,539评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,382评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,319评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,706评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,370评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,664评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,715评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,476评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,326评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,730评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,003评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,275评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,683评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,877评论 2 335

推荐阅读更多精彩内容

  • 中国人群的乳腺癌研究 2018年在 Nature Communications 杂志上在线发表了题为“Charac...
    小梦游仙境阅读 1,501评论 0 2
  • 非常优秀的研究总结,值得学习领会和思考。因为字数太多,可以去作者的博文地址http://www.huangshuj...
    王诗翔阅读 4,157评论 1 24
  • 我可以是小偷 但是我不可以教我的孩子去做小偷 因为希望不可以在我手里泯灭 我可以是小偷 但是我不可以让我的孩子也是...
    思念是水我是木阅读 243评论 0 0
  • 目前我在以结构式儿童游戏治疗的方式接儿童的个案,虽然通常家长将孩子送到中心,很放心的将孩子交给我们,但可能家长并不...
    峰至阅读 682评论 0 4
  • “春色满园关不住,一枝红杏出墙来。”盎然生机的校园里的春天就像那古壁上的题刻,抹不去也拭不掉,一切都来得静悄悄...
    吕慧玟阅读 280评论 0 0