单细胞测序方法和原理系列:
- 1. 单细胞转录组建库原理:SMART、TargetAmp和10X genomics
- 2. DNA文库构建和Illumina测序化学原理
- 3. 单细胞免疫组库:TCR基因重排原理和TCR测序建库方法
- 4. 单细胞ATAC-seq原理介绍与报告解读
- 5. CITE-seq:同时测细胞表面蛋白和RNA的单细胞测序
- 6. LIBRA-seq:快速开发单克隆抗体的单细胞技术
一、单细胞测序技术的发展史
二、多种平台的比较
三、液滴型单细胞测序技术比较
基于液滴的方法包括15年背靠背发在cell上的Drop-seq
和inDrop
,还有17年发在NC上的10X Genomics Chromium
。
三种液滴型方法采用相似的技术生成液滴,采用barcode标记细胞,应用UMI进行偏好校正。但它们在beads的制造、barcode的设计、cDNA扩增等不同。
三种方法的比较2019年发在molecular cell上
总体差异
三种平台中,Drop-seq和inDrop的细节在15年的cell中描叙的非常详尽。而10X作为商用平台,技术细节未完全披露(整合了inDrop和Drop-seq)
三种技术的珠子上的序列大体类似,包含PCR handle, cell barcode, UMI和poly-T。inDrop的beads还带有photo-cleavable moiety和一个T7启动子。
但是10X和inDrop采用的是有弹性的水凝胶beads (hydrogel),引物可以固定在beads里面,而Drop-seq使用的是聚苯乙烯固体磁珠,引物只能固定在beads表面。相较于Drop-seq体积较小的固体磁珠,inDrops与10x的胶体珠可以在微流控管道交汇处形变,能够耐受挤压,流速可控,最终可以达到几乎全部(98%)液滴含有规定数量的胶体珠(实现方差的超级小),在磁珠相打破了泊松分布(Sub-Poisson loading),实现了超泊松分布(super-Poissonian distribution)(仅细胞相服从泊松分布),从而大大提高了细胞的捕获率。(参考:基于液滴的单细胞测序通量:泊松分布与次泊松分布)
10X is reported to have ~80% bead occupancy and a cell capture rate of ~50%.
包裹到液滴后,10X的beads发生溶解,引物释放到溶液中可以提高mRNA的捕获效率。inDrop使用紫外诱导的切割技术释放引物。而DropSeq的引物不能从beads释放,会降低其mRNA捕获效率。
此外,DropSeq和10X的反转录等过程都在液滴内进行,有利于提高效率和降低试剂消耗。inDrop采用体外转录方式进行扩增,需要时间比较久。关于cDNA扩增的方法,inDrop使用的是CEL-seq,10X和Drop-seq使用的则是类似于Smart-seq的template-switching protocol。参考单细胞转录组建库原理:SMART、TargetAmp和10X genomics
结论
为了比较不同平台产生的数据,研究团队开发了可适用于三个分析平台的数据分析框架,方便数据比较。
结果显示:
- 基因表达聚类与分析使用的平台有关,表明存在基因水平的系统特异性量化偏差。研究人员仔细分析了每个平台中偏差的来源,发现Chromium平台偏爱较短的序列和GC含量较高的序列,而Drop-seq对GC含量较低的基因检测效果较好。
- 可捕获的细胞数目理论值:By rough estimation, the effective barcode size is ~5x104 for inDrop and at least 1x106 for Drop-seq and 3x105 for 10X。
但是10X Genomics微珠的条形码错配较少,另外两个平台有超过一半的细胞条形码出现明显的错配。其中,Drop-seq约10%微珠的条形码出现一个碱基缺失。
- 文库大小拐点法鉴定含有细胞的液滴,10X和inDrop拐点更明显
液滴型scRNA-seq方法中只有一小部分的液滴包含珠状物和一个完整细胞。然而生物实验不会那么理想,有些RNA会从死细胞或破损细胞中漏出来。所以没有完整细胞的液滴有可能捕获周围环境游离出的少量RNA并且走完测序环节出现在最终测序结果中。液滴大小、扩增效率和测序环节中的波动会导致“背景”和真实细胞最终获得的文库大小变化很大,使得区分哪些文库来源于背景哪些来源于真实细胞变得复杂。
大多数方法使用每个barcode对应的总分子数(如果是UMI)或总reads数的分布来寻找一个“break point”区分来自于真实细胞的较大的文库和来自于背景的较小的文库。
CellRanger假设真实细胞文库大小变化在10倍以内,用期望的细胞数目估计区间的分布。
- 10X Genomics检测到的基因数目相对更多,有效Reads比例也最高
- 就性能而言,10X Genomics的灵敏度最高,可在3000个基因中平均捕获17000个转录组;Drot-seq检测到2500个基因的8000个转录组;InDrop可检测到1250个基因的2700个转录组。灵敏度高的一个好处就是可以通过较少的reads获取相同级别的分子标记。此外,10X Genomics平台的噪音也最少。研究人员认为,inDrop平台噪音的一个来源是微珠的易变性,因为研究中出现了两批微珠检测同一样本的结果完全不同的情况。
液滴型单细胞测序平台各有优缺点,适用于不同应用。总体来说,10X Genomics的Chromium系统比Drop-seq或inDrop表现更强大,其技术噪音最小,稳定性最高。