二代高通量测序技术已广泛应用于疾病和癌症的研究,但由于其短读长的特点,对结构变异的检测有一定的局限性。以Pacbio和ONT为代表的三代长读长测序技术弥补了这一不足,但因成本相对较高限制了其广泛应用。三代目标区域测序技术,不仅保留了长读长的测序优势,又可以针对感兴趣的基因或区域以更高的性价比进行高深度测序研究。目前,三代目标区域测序技术已被应用于疾病或癌症领域HLA、STR、融合基因、甲基化检测等研究中。目标区域富集的方法主要有三类:长片段PCR扩增、CRISPR/Cas9靶向捕获和液相探针捕获。下面为大家进行一一介绍。
长片段PCR扩增
长片段PCR扩增因其引物设计成本低,实验流程规范,是基因组靶向富集常用的方法之一。但PCR过程中容易产生嵌合体、出现参考比对偏差[1],此外,基因组的复杂区域和高GC区域往往会影响PCR扩增效果,制约了其应用范围。长片段PCR扩增一般适用于非复杂区域变异检测研究。
Long-Read Nanopore Sequencing Validated for Human Leukocyte Antigen Class I Typing in Routine Diagnostics[2]
发表期刊:The Journal of Molecular Diagnostics(IF:5.561)
发表时间:2020年7月
人类白细胞抗原(HLA)的高分辨率分析是确定造血干细胞移植患者和供者相容性的金标准。Nanopore长读长测序能够直接跨越HLA区域,提供明确分型,但碱基的高错误率限制了其应用。该文章中第一阶段,选择已知HLA分型的33例样本,针对HLA I类基因HLA-A、HLA-B、HLA-C进行了特定基因全长扩增(扩增引物见表1),使用MinION 1D2建库试剂盒(SQK-LSK308)建库,MinION测序,使用2种HLA分析软件JSI和GenDx进行HLA分型分析,结果表明其分型结果与前期Sanger测序分型结果100%一致(表2),MinINO测序和分析流程图见图1。为了进一步验证该方法,第二阶段选择了67例临床样本进行MinION测序分析,与Sanger测序数据分析结果一致,该结果进一步表明了纳米孔测序技术已经发展到可以用于常规诊断并具有较高的准确性。
表1 扩增引物
表2 33例样本MinION分型结果和Sanger分型结果对比(仅展示前3行)
CRISPR/Cas9靶向捕获
Cas9靶向捕获技术,首先将DNA末端去磷酸化,然后用Cas9/guideRNA复合物引入新的切口,将测序接头特异性连接到剪切区域,从而达到靶向测序的效果。该技术无PCR扩增环节,可以同时进行结构变异、STR及碱基修饰鉴定等研究。
Targeted Nanopore Sequencing with Cas9-guided Adapter Ligation[3]
发表期刊:Naute Biotechnology(IF:54.9)
发表时间:2020年4月
目前的测序方法仍然受到无法检测碱基修饰,读长过短,核酸总量要求高,产量过低或实验流程过长等限制。该文章中作者开发了一种基于Cas9靶向捕获的纳米孔序列方法(nanopore Cas9-targeted sequencing,nCATS),该方法使用基于CRISPR–Cas9的靶向DNA捕获策略(图2A),将捕获的DNA进行纳米孔长读长测序。该文章表明nCATS技术可以同时进行SNP,SV,单体型和CpG甲基化鉴定。文章中研究发现多种guideRNAs组合可将 KRT19基因的覆盖率从47X提高到407X(图2B),MinION整个cell的覆盖率中位数提升到680X(图2C)。文章中将nCATS方法在GM12878细胞系上检测的SNV与白金数据集进行比较,验证了双链数据过滤后SNP检测的准确性,结果显示只有一个假阳性位点存在于胸腺嘧啶密集的均聚物区域。将nCATS甲基化数据与WGBS数据进行了比较,结果显示每个CpG相关性为0.81。该方法将促进长读长测序技术在医学研究和临床中的应用。
液相探针捕获
针对感兴趣的基因或区域定制特异性探针,通过探针与基因组DNA进行杂交,将目标区域片段捕获富集后进行测序分析研究。但该技术由于建库环节中存在PCR扩增环节,会丢失碱基修饰信息,且需要额外考虑定制探针的周期。
Efficient Sequencing, Assembly, and Annotation of Human KIR Haplotypes[4]
发表期刊:Frontiers in Immunology(7.561)
发表时间:2020年10月
天然杀伤细胞免疫球蛋白样受体(KIR)区域具有高度同源性、重组率、多态性及重复序列等特点,利用二代高通量测序不能得到完整的单倍型信息。文章中提出了一种自主设计探针捕获目标区域,利用长读长测序来组装人类二倍体KIR单倍型的新方法。该方法设计了18个捕获探针来捕获KIR区间长度为2-8kb的DNA片段。采用PacBio Sequel平台CCS模式进行测序,使用Canu软件进行组装,按照KIR基因划分区域,基于每个基因和KIR全长进行组装,最后注释序列的位置信息。为了评估该流程的可靠性,作者对16个样本(单倍型信息已知)进行组装和注释评估。组装结果表明,仅使用18个探针对KIR区域进行捕获,就覆盖了参考基因组的97%,序列一致性为99.97%。该研究所提出的靶向探针捕获测序方法是第一个对人类所有KIR二倍体进行完整测序和组装的方法,可以有效地应用于人群规模研究和临床研究中。
综上,三代目标区域测序技术有PCR扩增,Cas9靶向捕获和探针液相捕获三类靶向富集方法,其优劣势总结如下(表3),可结合具体研究需求进行选择。
表3不同目标区域捕获方法比较汇总
参考文献
[1]Laver TW, Caswell RC, Moore KA,et al.Pitfalls of haplotype phasing from amplicon-based long-read sequencing[J]. Scientific Reports. 2016;17(6):21746.
[2]Matern BM, Olieslagers TI, Groeneweg M, et al. Long-Read Nanopore Sequencing Validated for Human Leukocyte Antigen Class I Typing in Routine Diagnostics[J].The Journal of Molecular Diagnostics. 2020 ;22(7):912-919.
[3]Gilpatrick T, Lee I, Graham JE, et al. Targeted nanopore sequencing with Cas9-guided adapter ligation[J]. Naute Biotechnology. 2020;38(4):433-438.
[4]Roe D, Williams J, Ivery K, et al. Efficient Sequencing, Assembly, and Annotation of Human KIR Haplotypes[J]. Frontiers in Immunology . 2020;9(11):582927.