Barcoding || 海量单细胞的关键技术

海量单细胞技术涉及到三大底层技术:

  • 微流控技术
  • Barcode 技术
  • UMI技术

故事要从第一届单细胞培训班开始讲起,还记得在讲完第一场单细胞技术简介及应用之后,问大家有没有什么问题可以讨论。有位老师问:请问什么叫Barcode?

我们知道海量单细胞技术是在微孔或液滴中物理隔离单个细胞,在这个小格子中裂解细胞,释放mRNA(或其他细胞内小分子信息),这里第一步就是用Barcode来对每个小格子里面的细胞来加标签。目前的技术是把成千上万的Barcode种在一个磁珠上,把这个磁珠放到小格子里标记细胞。

今天我们讨论的就是这个barcode。

  • barcode 多长是合理的?
  • barcode之间的汉明距离对单细胞实验的影响
  • barcode 还可以标记其他生物信息吗?可以,已经在用了。

作为一种标记技术,DNA条形码(DNA barcode)是指生物体内能够代表该物种的、标准的、有足够变异的、易扩增且相对较短的DNA片段。DNA条形码已经成为生态学研究的重要工具,不仅用于物种鉴定,同时也帮助生物学家进一步了解生态系统内发生的相互作用。随着时间的推移,条形码越来越多地用于追踪单个细胞,并定量评估它们对克隆的贡献。尽管条形码定量完全依赖于计数测序读数,但对该方法准确性的详细研究仍然有限。

barcode 本质上是一串碱基序列,如AAAAA、ATCAAGTTC等等。作为细胞的标签,我们认为这段分子标签至少要是稳定的,如果是一段有许多GC碱基组成的序列,那么它的稳定性很可能达不到要求。这段分子标签要从细胞裂解,经过UMI标记分子,RT,建库测序。所以我们在设计这个段序列的时候,要考虑它的用处。同时还要考虑它的可合成性。

另一个主要的问题就是关于生产的,在固定了barcode的长度之后,就要考虑合成什么样的序列了,如果合成的序列太相似,就很可能把不同的磁珠标记上一样的barcede。这样磁珠一旦形成,就会使得不同的油滴或微孔形成带有一样的barcode,从而形成另一种双细胞(不是一个微孔或者液滴包含两个细胞的那种)。所以我们可以根据barcode的距离推断这种可能性,衡量序列相似性的一种方法就是汉明距离。

汉明距离是以理查德·卫斯里·汉明的名字命名的。在信息论中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。下面我们来算一下几个例子:

library(stringdist) # 至少你应该知道我用的是R语言
stringdist('ATGCCTAA','ATGCCTAA', method = "hamming")
[1] 0
stringdist('AAAAAAAA','ATGCCTAA', method = "hamming")
[1] 5
stringdist('AAAAAACC','ATGCCTAA', method = "hamming")
[1] 7

那么barcode列表的最小汉明距离越大,那么这个系统就更加稳定。目前市场上主流的两款技术10X和新格元的barcode列表都是可以在其开源软件查到的,所以可以比较一下。

新格元的barcode 列表在其定量软件CeleScope软件(可以在github或gitee)中的路径是:CeleScope/celescope/data/chemistry/scopeV2.0.0 #新格元的barcode是组合起来的,具体可以阅读CeleScope源码了解其结构。

10X 的定量软件Cellranger(可在其官网下载)中Barcode列表在:cellranger-X.X.X/lib/python/cellranger/barcodes

分享一个粗略的方法来寻在其barcode的最小值:

seq1 = barcodelist
library(tidyverse)
min(unlist(map(1:10000,function(i){
    x = sample(seq1,1)
    y = sample(seq1,1)
    while(x==y){y=sample(seq1,1)}
    stringdist(x,y, method = "hamming")
    })))

汉明距离的另一个应用场景是用来做barcode的纠错,二代测序不是完美的测序技术肯定会有测错的情况,那么如何判断测出来的序列是不是一个细胞的barcode呢?一般的方法是在其定量软件里面内置一个白名单,拿测的序列和这个白名单比较,来矫正barcode。对于没有出现在白名单的barcode允许某个汉明距离的差异。

所以在你的单细胞系统里面,这些关键问题思考全面了吗?


Thielecke, L., Aranyossy, T., Dahl, A. et al. Limitations and challenges of genetic barcode quantification. Sci Rep 7, 43249 (2017). https://doi.org/10.1038/srep43249
https://bookdown.org/lambdamoses/museumst/current-techs.html
https://bioinformatics.stackexchange.com/questions/5183/why-are-there-more-barcodes-than-gems-in-10x-chromium-data
https://kb.10xgenomics.com/hc/en-us/articles/115003133812-How-does-cellranger-count-process-and-filter-UMIs-
https://kb.10xgenomics.com/hc/en-us/articles/115004037743-How-does-Cell-Ranger-correct-for-amplification-bias-
https://github.com/singleron-RD/CeleScope

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,905评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,140评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,791评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,483评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,476评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,516评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,905评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,560评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,778评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,557评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,635评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,338评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,925评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,898评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,142评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,818评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,347评论 2 342

推荐阅读更多精彩内容