最近得知王通老师Nanopore测序技术的培训课在B站免费了,那一定是要跟进一波了。王老师在2019年下半年在公众号以四十八个专题分享了Nanopore测序原理、应用以及数据分析教程。其实再写笔记已经没有什么必要了,因为要说的话:直接去看王通老师的公众号以及B站就好了。但是,老师懂得再多,学生还是要学习的哦。
周末把王老师的四十八个专题打印出来,好好学习一把,也简单谈谈Nanopore测序技术吧。每当提到新的技术,我会不由得想起马克思的一句话:任何真正的哲学都是自己时代的精神上的精华。一个优秀的产品也是这样,应该是这个时代技术的精华,代表了一个时代的先进生产力。Nanopore技术的出现告诉我们,我们已近到了一个这样的生命科学时代:使任何人、在任何地点、能对任何生物进行分析。
2003年,人类基因组计划基本完成。该计划的实现不仅在人类探索生物史上谱写了史诗般的篇章,同时也为基因检测在人类遗传病中的运用奠定了重要的基础。某种意义上说,人类基因组计划的实现并不意味着结束而是开始。
什么是Nanopore测序技术
关于Nanopore测序技术最令人印象深刻的一幅图是这样的:
它基本勾勒了Nanopore测序技术的过程:单链DNA分子的ATCG碱基就像阅兵时候的兵哥哥一样路过天安门广场,通过纳米孔的时候释放不同电信号被捕获而后被识别解码为碱基顺序。我们不禁在想:
- DNA分子的头如何找到这个孔的呢?
- 是谁牵引着DNA单链往下走的呢?
- 去哪找这样合适的材料呢?
带着一系列疑问我们看看Nanopore测序技术的简史:
Oxford Nanopore Technologies 有限公司是一家私营企业,总部位于英国牛津市外的牛津科学园,在英国剑桥、美国纽约和波士顿设有办事处,并在日本和法国驻有工作人员。
公司成立于 2005 年,致力于开发基于纳米孔科学的突破性、单分子、电子传感系统。公司的首例产品 MinION 于 2014 年推出,进入客户早期试用阶段,并于 2015 年开始销售。之后,更高通量的 GridION 和 PromethION于 2017 年面世。公司拥有丰富的研发产品线,其中包括可与手机兼容的 SmidgION测序仪。
据说nanopore灵感来自1989年:
nanopore是不是一个好的测序技术呢?要回答这个问题也许我们要回答的是:到底什么才是好的技术?
- 准确
- 简单
- 通量高
- 长
- 快
- 便宜
这五个往往不能同时满足,但是有的技术线会逼近它们。Nanopore测序工艺其实也是分为:建库和测序。建库是对序列修饰一番以便于测序,测序就是一个碱基判读的过程。我们还记得沃森和克里克是如何判读的吗?让我们来回顾一下经典的历史场景吧:
显然我们不可能拿个尺子指着一个碱基说:这是T,这是U。
于是:
来到Nanopore其实是完成了从化学信号到光学信号到电信号的转变。
为什么要用Nanopore测序技术
- 超长读长
- 直接测序
- 实时测序
- 按需测序
- 启动费用低
- 灵活可扩展
其实最诱人的是它的愿景:倒数第二代测序技术。如其官宣的:
我们的目标:使任何人、在任何地点、能对任何生物进行分析
Oxford Nanopore Technologies 致力于突破现有生物分析方式。我们的技术和商业模式已经让之前未曾直接接触过测序技术的研究人员能够自由地在自己的实验室中或实地进行实时DNA测序和分析。我们一直坚持不断改进技术性能,提高技术易用性,并积极开发更便于用户使用纳米孔测序技术的新领域。这一技术平台旨在使任何人、在任何地点、能对任何生物进行分析。
Oxford Nanopore 成功研发了世界上首例且唯一的纳米孔 DNA 测序仪——MinION。MinION 是一款便携式、实时、长读长、低成本的设备,旨在让任何人,不论是在科学研究、教育、还是在一系列实际应用中,例如疾病/病原体监测、环境监测、食物链监测、自我量化、甚至微重力生物学等领域,都能进行简便的生物分析。自 2015 年开始销售以来,MinION 已被分布在70 余个国家的科学家们广泛使用,助力于他们的科研工作,实现了在传统实验室内和实地环境下的众多应用。
纳米孔传感测序技术具备完全的可扩展性。GridION X5 是一款配有计算模块的台式测序仪,具有可运行多达五个 MinION 测序芯片的能力。此外,另一款具有高通量、高采样数特点的 PromethION 测序仪。
这里我看完都热血沸腾了。之前我们想象到的测序是这样的:洁净敞亮的大型实验室,鳞次栉比的测序仪,不断地吐露着序列。而Nanopore测序的应用场景是这样的:
可以说极大地丰富了我们的想象力啊。这感觉就像当年用第一代电子计算机的人看到智能手机一样。
也许在某种程度上二代测序已经很成熟了,能完成测序的绝大多数的应用,但是它还是太过于“工业”了。
Nanopore测序技术怎么用
答案是想怎么用就这么用,现阶段可能要加一个限制,就是有点贵。
首先是Nanopore可以用于DNA以及RNA的测序,也就是我们的基因组和转录组均可以用Nanopore来进一步完善和补齐相关的结构信息。比如2019年的病毒序列:
其实要说一种测序技术的应用不外乎:实验设计,样本捕获,建库测序,数据分析。但是各种技术又有应用的偏重,Nanopore的典型应用:
- 大基因组组装
- 细菌完成图
- 全长无偏倚转录组
- 大片段结构变异
- 突变定相分析
- 微生物快速鉴定
针对不同的应用场景,Nanopore推出了不同的仪器:
每种仪器都配有应用场景以及配套的设施,但是我们并没有必要了解每一个仪器的参数,直到我们真的要用它的时候。
说了这么多,拿到Nanopore数据之后到底该怎么办?
首先Nanopore的数据格式是fast5格式,处理这种格式可以用:
也许你会问fast5格式是什么样的,就是一种存存储各种信息的分层压缩文件。
大多数生物信息分析的数据都是从fastq格式开始,那么我们要做的也就是basecalling。basecalling出fastq文件后面的流程我们也就熟悉了,质控,比对,处理bam文件。只是由于Nanopore的长读长的特点,一些基二代测序的软件看能不能适用了。对我们一般用户来说不过是换个软件配参数与文件就可以了。这里强烈加以大家学习一下conda,用这个安装软件不要太爽。
这里直接把王老师为我们准备的软件列表搬过来吧:
每一个软件都可以写一篇新的文章了,所以不在本文的讨论之列。
软件有了,然后就可以生产数据进行分析,当然在学习的前阶段,我们可以下载一些数据进行学习。