1. 概念
外显子组是指全部外显子区域的集合,在人类基因组中,该区域仅占1%,却包含合成蛋白质所需要的重要信息,涵盖了与个体表型相关的大部分功能性变异。全外显子组测序是利用序列捕获技术,将全基因组外显子区域的DNA捕捉、富集之后,进行高通量测序的基因组分析方法。相较于全基因组重测序,外显子组测序在同样的通量下数据覆盖度更深,准确性更高,更加简便、经济、高效,目前已广泛应用于孟德尔遗传疾病、复杂疾病,以及癌症的研究中。
优势:
高覆盖度:有效覆盖外显子及UTR区域,平均测序深度超过100
高测序深度:可发现常见变异及频率低于 1% 的罕见变异
高性价比:针对外显子组及其附近区域进行测序,有效降低费用,周期和工作量
- 直接对蛋白编码序列进行测序,找出影响蛋白结构的变异
- 高深度测序,可发现常见变异及频率低于 1% 的罕见变异
- 针对外显子组区域测序,约占基因组的 1%,有效降低费用和工作量
2. 应用方向
1. 孟德尔单基因病的研究
目前大部分已知的孟德尔单基因病都涉及到基因座上蛋白编码序列的改变,致病突变大多位于外显子区域。利用全外显子重测序技术,可以快速、准确的找出外显子区域所有突变,更高效的挖掘孟德尔遗传病的致病基因。
eg:
孟德尔遗传研究 (华大科技)
• 研究脊髓小脑性共济失调[8],发现致病基因-TGM6
• 研究逆反性痤疮[9],发现致病基因-NCSTN
• 研究高度近视[10],发现致病基因—ZNF644
• 研究Olmsted 综合征[11],发现潜在靶标-TRPV3
孟德尔遗传研究 (诺禾致源)
马布里综合症 [1]: 发现致病基因 PIGV;
逆向性痤疮 [2]:发现致病基因 NCSTN;
眼皮肤白化病 [3]:发现致病基因 SLC24A5;
先天性肾脏和尿道畸形 [4]:发现致病基因 DSTYK;
2. 复杂疾病研究
复杂疾病是指在众多因素共同作用下发生的疾病,如多个基因、一个基因的多个突变、环境作用或其他未知的随机因素,遗传模式复杂,如精神分裂症、双相情感障碍、糖尿病等,一般认为单个突变的影响有限,单独发生不足以致病。目前业界对罕见突变在复杂疾病中的作用尚缺乏全面理解,外显子测序技术可以对基因组蛋白编码区的突变进行高覆盖度的精确检测,是一种经济有效的分析遗传病病因的手段。
复杂疾病研究(华大科技)
• 糖尿病关联基因及变异研究(LUCAMP)[3]
• 基因胚系de novo突变与自闭症之间的关联性研究成果[4]
• 慢性乙型肝炎(CHB)相关罕见变异易感基因[5]
• 研究注意力不足/多动症家系,找到潜在致病稀有变异[6]
• GWAS已发现44个银屑病相关的易感基因/位点[7]
诺禾致源
混合型低脂血症 [5]: 发现致病基因 ANGPTL3;
孤独症 [6]:发现 11 个新生突变
3. 肿瘤研究
利用外显子测序技术检测体细胞突变遗传变异,可以帮助癌症研究人员发现人类癌症发病过程中的重要变异,对于癌症通路研究起了重要作用。
华大科技
• 肾上腺皮质肿瘤[12],找到发病密切相关基因-PRKACA
• 膀胱移行细胞癌[13],发现染色质重塑相关基因- UTX等
• 肾透明细胞癌[14],找到某种蛋白降解通路的相关基因
• 胰岛素瘤[15],发现发病机理相关基因-T372R
• 食管鳞癌[16],找到发生发展进程和临床预后相关的基因
诺禾致源
分子水平对肿瘤进行分型[7]
PDX 模型研究药物耐受机制[8]
ctDNA 研究肿瘤异质性及克隆进化[9]
3. 技术流程
样本选取及质检 > 建库捕获 > 测序 > 信息分析
3.1 样本选取及质检:
按照家系遗传规律,选取一个/几个相同疾病家系的核心成员或散发样本等,肿瘤研究需要取患者的癌旁组织以及正常组织作为对照。
为了保证测序质量,需对DNA进行质检合格后方可进行后续操作,要求DNA样本电泳检测为单一条带,无明显降解,无RNA和蛋白质污染,浓度和总量要求:
样本 浓度 体积 纯度(A260/280) 总量
DNA >50 ng/μL > 40 μl >1.7 > 2.0 μg
3.2 建库 & 捕获
DNA经酶法处理后打断为200 - 300 bp的小片段,利用Agilent SureSelect捕获外显子区域DNA片段用于测序。
DNA经酶法处理打断为。。 bp的小片段,经末端修复、接头连接后,构建测序文库;文库变性为单链DNA后,加入生物素标记的与目标区域互补的探针进行双链复性,加入链霉素亲和素标记的磁珠,混合使生物素和链霉素亲和素结合;加入磁场富集‘磁珠-链霉素亲和素-生物素-探针-目标区域'复合体,去除磁场后洗脱磁珠,收集捕获的DNA片段用于测序
3.3 测序
捕获后的DNA片段进行Illumina上机测序,推荐测序深度100X以上,如果为肿瘤研究,则要求更高的深度。
3.4 信息分析
生信可以分析的东西
4. 技术参数
测序读长:PE150
深度: 100X
数据量:10G
周期:
5. 样本要求
- DNA样品:总量≥0.5 μg;干冰或冰袋运输;
- 外周血:3-5ml;EDTA抗凝管,冰袋运输;
- 组织样本:≥50 mg;冰袋运输;
- FFPE:4-6片(5-10 μm厚,1 x 1cm2大小)
6. 案例分享
(单基因病)
利用外显子组测序解析卵细胞发育障碍
人是由成熟的卵细胞和精子细胞结合产生受精卵发育而来,一旦女性无法产生成熟的卵细胞则无法产生后代,阻滞卵细胞成熟的遗传机制尚未明确。为了了解卵细胞发育障碍的原因,针对一个四代的大家系选取了3个case样本,2个control样本进行了全外显子测序。从测序所得的突变中筛选病人中携带,而正常人未携带的变异,且该位点在1000 Genomes,NHLBI,ExAC中频率低于0.1%。最终发现TUBB8基因上的一个c.686T>C p.V229A突变。针对该位点对该家系II-4,II-5,III-5进行Sanger测序验证,发现该病人的变异遗传自父亲。随后另取其他六个家系进行该基因的验证,均存在TUBB8的突变。对该基因进行相关的细胞功能实验,结果发现TUBB8基因只分布于卵细胞和早期胚胎,与β-微管蛋白的形成有关;该基因的突变影响纺锤体的形成,导致卵细胞发育障碍。
(复杂疾病)
外显子组测序挖掘血友病凝血因子抗性基因相关位点
A型血友病传统治疗方法是通过每周注射第八凝血因子(coagulation factor VIII
(FVIII))2-3次控制偶发的出血,但大约30%的血友病患者会对该凝血因子产生抗体,导致此疗法失效。这种抗性是由于环境和遗传等多种因素共同作用产生的。为了挖掘新的血友病凝血因子抗性基因相关位点,对26个意大利血友病患者(17个携带抗体,9个不携带抗体)进行全外显子组测序。对测序所得的位点质控过滤后,首先关注了与免疫调节基因相关的罕见有害突变;采用卡方检验(Cochran-Armitage)和费舍尔精确检验(Fisher’s exact )进行case-control关联分析,定位到1364个显著(P<0.05)位点,从这些位点中过滤获得28个有害突变。扩大样本量(53个F VIII抗体阳性患者和174个抗体阴性患者),采用TaqMan分型定位技术对这28个变异位点进行验证,结果发现rs3754689错义突变与血友病凝血因子抗性显著相关(OR 0.58;95% CI 0.36-0.94;P=0.028)
(肿瘤)
全外显子测序和目标区域测序技术结合助力骨髓增生异常综合征
骨髓增生异常综合征(Myelodysplastic syndromes,MDS)是一种异质性的造血干细胞异常,有造血异常、外周血血球减少的特点。高达30%的骨髓增生异常综合征患者会发展成急性髓性白血病acute myeloid leukaemia (AML)。为了揭示此转变的分子机制,取3例MDS患者的样本进行全外显子分析,获得体细胞突变,过滤后获得26个关键基因,其中包括了ROBO1和ROBO2基因。扩大样本量后,对此26个基因进行高深度的目标区域测序,发现209例样本中有26位患者 (12.4%) 携带ROBO1和ROBO2突变;对不同阶段的患者进行ROBO区域的CNV和杂合性缺失(LOH)分析,结果发现高危状态的患者CNV/LOH的频率(50%, 7/14)比低危状态患者(14.3%, 2/14)更高。体外实验表明,过表达ROBO1或ROBO2基因有控制癌细胞增长的作用,且ROBO1或ROBO2突变导致的ROBO/SLIT2信号失活可能推动疾病进展。