基于液滴的单细胞转录组测序Drop-seq:从建库到测序的介绍

说起单细胞转录组,现在基本已经成为了高分文章的代名词。由于相比于基于整块组织或整片培养细胞总体RNA的bulk RNA-seq,单细胞转录组测序的分辨率提高到了单个细胞的层面,去掉了不同细胞种类之间基因表达可能互补混淆的混杂因素,所以在分辨细胞和组织异质性上具有很大的优势。

目前单细胞转录组的建库方法基本可以按照技术方案分为两类:

(1)一类依赖于孔板:

通俗的说,就是将已经解离的单个细胞分配到孔板中各自的孔中,在孔中单个细胞完成裂解、RNA富集、加细胞条码(cell barcode)和单分子识别码(Unique Molecular Identifier, UMI)等步骤后再收集到一起进行测序。而具体的实施方案会根据每种建库方案有一些特色型的变动。目前这一类方法包括CEL-seq、CEL-seq2、SMART-seq、SMART-seq2、Microwell-seq等。

特点:

● 基于孔板的建库方法总体来说难以达到很高的通量(如SMART-seq2是基于96孔板,那么同批次只能测96个单细胞;microwell-seq通过缩小孔的体积扩大了可以同批量测序的细胞数目)。

● 有基于全长转录本进行测序的条件(SMART-seq2的multiplex方法:对全长cDNA进行tagmentation,测序后通过对片段两侧的i5 index和i7 index组合解析从而判别该cDNA的样本孔来源),所以可以测到更多的基因,且准确度和灵敏度更高。

(2)另一类依赖于液滴:

大致可以理解为通过微流控技术将单个细胞和一个捕获RNA的微珠(beads)包裹在液滴中,beads连接的mRNA捕获oligo上已经预先包含cell barcode和UMI信息,在液滴中完成至少mRNA的富集后再将微珠合并,完成建库并测序。具体的实施方案也是随着不同的方法学有些许差异。目前这一类方法包括Drop-seq、inDrop、10×genomics等,10×genomics已经成功商业化。

特点:

● 基于微流控液滴的单细胞测序建库的优点是可以短时间内同批次处理更多细胞(数千以上),但由于beads对mRNA的捕获率所限,这种方法在获得细胞数量的突破的同时,可以测到的基因数减少。

● 这类方法仍主要采用3‘末端建库的方式(只取cDNA的3’末端测序),所以在基因比对和定量的准确度上不及(1)。

(3)其他:SPLiT-seq以细胞本身作为“EP管”,将细胞膜穿孔后进行多轮split-pool的原位barcode连接,待每单个细胞内的RNA理论上均带有细胞特异性tag后再pool together。还有最开始的手挑单细胞等等。这些“异类”就不多说了~

单细胞转录组测序方法的发展历程:图源来自Svensson V, Vento-Tormo R, Teichmann S A. Exponential scaling of single-cell RNA-seq in the past decade[J]. Nature Protocols, 2018, 13(4):599-604.

如果目前还看不懂以上的文字,相信看完本文后将会对以上的特点有一定的感性认识。

本教程中,我们结合核酸序列和实验流程,详细介绍Drop-seq的建库方法原理。

其他单细胞转录组建库方法学【非常好】的介绍教程:
SMART-seq2的建库方法已经有了详细的介绍:单细胞smart-seq2建库原理
10×genomics的建库方法也已经有了详细的介绍:10X单细胞3‘转录组建库原理

Drop-seq首次发表在这篇论文中:
Macosko EZ, Basu A, Satija R, et al. Highly Parallel Genome-wide Expression Profiling of Individual Cells Using Nanoliter Droplets. Cell. 2015;161(5):1202‐1214. doi:10.1016/j.cell.2015.05.002
论文附录中可以下载到详细完整的操作Protocol。

Core materials & devices:

(1) micro-beads

Drop-seq采用连有oligo的树脂微珠对单个细胞的mRNA进行捕获。在合成PCR的引物结合部位(与TSO序列相同,后会详述)后,通过12轮split & pool的策略合成oligo上的12bp cell barcode部分,随后用degenerate oligonucleotide synthesis策略合成8bp UMI,最后合成用于捕获mRNA 3' polyA尾的polyT片段。

Oligo的组成:5‘ 文库扩增PCR引物结合部位-cell barcode-UMI-polyT 3'

对于每个bead:一个bead上的所有oligo有相同的cell barcode,每条oligo有不同的UMI。理论上一个bead将与一个细胞同时包裹进入一个液滴中,该bead捕获该单细胞的转录组,最后来源于同一细胞的序列带有相同的cell barcode,每条独立的mRNA拥有专属的UMI。

文献关于beads合成的图示
(2)micro-fluidic device

如图所示,使用该微流控系统可以产生cell-bead液滴。

核心为一块硅胶微流控芯片,其联通输入、输出管道。油、细胞、beads在此处相遇并产生droplets。

输入包括3个由注射泵控制的细胞悬液、oil、beads(悬于lysis buffer中)。它们在泵的控制下以相应的速率注入芯片。细胞和beads在水相中相遇后,被oil分隔从而在管道中产生水相droplets。

输出为油以及被油分隔的droplets。理论上droplet中单细胞应在lysis buffer的作用下发生裂解,并由相伴的Beads捕获mRNA。

产生droplets的微流控系统

重要序列

下面会结合核酸序列进行建库的解释,这些序列是很重要的(均为5'→3'):

Barcoded_Bead_Seq: 
Bead–Linker-TTTTTTTAAGCAGTGGTATCAACGCAGAGTACJJJJJJJJJJJJNNNNNNNN TTTTTTTTTTTTTTTTTTTTTTTTTTTTTT
Template_Switch_Oligo: 
AAGCAGTGGTATCAACGCAGAGTGAATrGrGrG
TSO_PCR_primer:
AAGCAGTGGTATCAACGCAGAGT
P5-TSO_Hybrid:
AATGATACGGCGACCACCGAGATCTACACGCCTGTCCGCGGAAGCAGTGGTATCAACGCAGAGT*A*C
Nextera_N70X:
CAAGCAGAAGACGGCATACGAGAT[XXXXXXXX]GTCTCGTGGGCTCGG
Read1_Custom_primer:
GCCTGTCCGCGGAAGCAGTGGTATCAACGCAGAGTAC
Nextera_XT_read2_primer:
GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG

建库流程:

最简略地可以分为如下步骤:(1)解离组织/细胞为单细胞悬液、准备beads、调试仪器→(2)通过微流控系统获得droplets→(3)裂解droplets、收集beads→(4)逆转录和模板转换(Template Switching)→(5)核酸外切酶I处理→(6)第一轮全长cDNA的PCR→(7)转座酶法打断并tag文库→(8)第二轮PCR:选择性扩增cDNA 3'端并添加测序接头→(9)上机测序

原文章中对Drop-seq建库流程的图示
(1)解离组织/细胞为单细胞悬液、准备beads、调试仪器

这一步在原理上没什么可说的,比如要收集白细胞,使用MACS磁珠过滤/红细胞裂解液就可以得到单个目标细胞悬液。如果有实际要做的需要,可以参考Cell文章附带的protocol进行。

(2)通过微流控系统获得droplets

如前所述,此时run the system得到的outflow (droplets)中,细胞已经被用于重悬beads的Lysis buffer裂解,释放出mRNA后,其3'端polyA尾与bead上对应oligo 3'末端的polyT尾互补捕获。

beads在droplet中捕获单细胞转录组
(3)裂解droplets、收集beads

在把droplets收集到outflow后,每个droplet中的beads已经获得了单细胞转录组(合称为STAMP,single-cell transcriptome attached to the micro-particle),而且beads的oligo已经记录了分子特异性和细胞特异性的条码信息,因此随后的操作可以pool together。该步骤裂解droplets获得所有beads,然后对其进行洗涤纯化。

(4)逆转录和Template switching

在捕获到mRNA后,加入Maxima H- RTase逆转录酶进行逆转录。RTase以捕获到的mRNA为模板,5'→3'延伸beads连接的DNA序列,得到转录本的全长anti-sense序列。由于这种逆转录酶的末端转移酶活性,在逆转录结束后,cDNA第一链的末端会被添加上连续的3个胞嘧啶 (C)碱基。这也是Template Switching的基础。

Template switching技术常用于获得全长转录本cDNA。加入的TSO (template switching oligo)的3'末端有3个核糖鸟嘌呤 (rG),正好与之前bead oligo3'端的CCC互补。使用rG的原因是因为RNA-DNA杂交的热稳定性更好。

此时逆转录酶的模板就switch到了TSO,继续5'→3'延长第一链cDNA,合成TSO互补序列,并形成局部双链。

逆转录和template switching图示
(5)核酸外切酶I处理

到此时我们可以基本发现STAMP继续处理的套路:下一步应该就是用与TSO互补的引物进行cDNA第二链的合成,且由于bead oligo的两侧是互补的序列,利用该单引物就可以进行PCR扩增,从而将STAMP脱离beads。

为了避免未捕获到mRNA的bead oligo产生混杂影响,使用具有3'→5'单链DNA外切酶活性的Exo I降解掉这些序列。

(6)第一轮全长cDNA的PCR

此时连接在beads上的cDNA第一链同时包含了cell barcode,UMI,和转录本序列。接下来就进行扩增并pool together,使文库脱离beads,且上面的条码信息仍可以分辨其来源(由于我们假设UMI重复的几率极小,因此在后续分析中,我们可以将含有相同UMI的reads识别为PCR复制所得,从而有效去重复,减少PCR带来的偏差)。

利用单primer对全长cDNA文库的扩增

PCR之后我们EP管中的序列结构就是如此:
这里可以把cDNA按照第二链的5'-3'顺序划分为:3'末端(TSO+cell barcode+UMI+polyA+partial transcript seq)、中间序列(partial transcript seq)、和5'末端(partial transcript seq+TSO)。

全长cDNA文库的序列结构
(7)转座酶法打断并tag文库

既然获得了单细胞的全长文库,接下来就要想办法把它与测序仪兼容(测序序列长度的修剪,P5/P7接头序列的连接)。这一步使用Nextera XT对扩增后的全长cDNA library进行tagmentation来一步完成。

Tagmentation的原理是利用Tn5转座子,将全长cDNA随机打断成数百bp的片段,并在打断的两端插入与转座酶序列。Nextera XT的转座子大约是图中这样的:

Tn5转座子的模式图
illumina对tagmentation原理的图解(过于简略...)

Illumina的设计是将它的插入序列分别作为read1和read2的测序引物,非常巧妙的设计。

但是在Drop-seq文库的建库过程中,我们不需要两侧都被tag的中间片段,而是需要包含了cell barcode、UMI和残余转录本序列的cDNA3'末端片段(上面已经解释过)。因为在文库被打断后,仅有这部分还保留有单细胞来源和分子来源信息,同时也含有部分转录本序列可用于基因组比对。这就是3'末端建库的原理。

转座打断后我们可以获得很多种产物(仔细想想看)。由于作者已经设定了自定义的read1引物,并打算通过read1获得cell barcode序列和UMI,所以我们需要利用read2获得基因序列信息。

所以得到的10种打断产物中我们只需要下图中打红框的这一种,它是cDNA的3'末端,并可以与read2 primer适配:

tagmentation后的结果产物

不过这种选择没办法手动选,我们会通过接下来的semi-suppressive PCR来仅仅有效扩增这一种产物。

(8)第二轮PCR:选择性扩增cDNA 3'端并添加测序接头

该轮PCR的目的就是为了突出刚刚获得的3'末端文库,并在末端加上测序仪适配的P5/P7接头序列。PCR的第一轮肯定是补齐转座酶序列的缺口:

补齐后的目标片段

接下来就依靠加入的P5-TSO hybrid引物(自定义read1在这段序列中)和read2-index-P7引物(商品化Nextera N70X oligo,其中含8bp P7 index,可用来区分样本批次)进行目标序列的扩增了。其他tagmentation的产物序列由于缺乏成对引物,所以无法有效扩增。

第二轮PCR到建库完成

最后使用Ampure XP beads对文库进行选择性纯化,弃去其他不需要的序列就可以得到待测序文库了!

The final: paired-end sequencing

Drop-seq可以用MiSeq或NextSeq测序仪进行测序。
利用刚好覆盖到cell barcode前的read1引物 (Read1_Custom_primer),可以测序长度为20bp的read1 (cell barcode 12bp + UMI 8bp)。
利用刚好覆盖到i7 index前的index引物,可以测序长度为8bp的Sample index(区分同一批次上机的不同样本用)。
利用刚好覆盖到转录本3'末端序列前的read2引物 (Nextera_XT_read2_primer),可以测序长度为50bp的read2。

上机测序的序列图示

在下机后的数据分析中,就可以使用read1指定细胞来源和分子来源(相同的cell barcode可表明这些reads来源于同一个细胞,而cell barcode和UMI均相同的reads会被认为是来自于PCR duplication而被collapsed);而使用read2比对基因组,进行基因的识别和定量了。

原文中对测序和read-pairs的解读
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335