单细胞分析实录(1): 认识Cell Hashing

这是一个新系列

差不多是一年以前，我定导后没多久，接手了读研后的第一个课题。合作方是医院，和我对接的是一名博一的医学生，最开始两边的老师很排斥常规的单细胞文章思路，即各大类细胞分群、注释、描述，所以起初的几个月都在摸索一条主线，再后来有主线了，要加实验验证，周期有点长。我这边的分析基本做完。读研生活还在继续，我也不能太在意这一个课题，尽管有些时候我也很着急，尽管我在这个课题上花了很多时间。整理分析流程是个好习惯，最大的受益者还是自己，所以接下来我打算把我在处理单细胞转录组过程中，学到的用到的所有技能以这样的形式写出来，估计有二三十篇吧~

我想先从Cell Hashing这样一种改良的单细胞测序技术开始

1. CITE-seq

事实上Cell Hashing是在CITE-seq的基础上改进的，CITE-seq全称cellular indexing of transcriptomes and epitopes by sequencing，是一种同时对细胞内RNA和细胞表面蛋白进行测序的技术。

测序原理如上图，将特定的抗体连上一段序列，序列上包含与抗体信息对应的antibody barcode，像右上方表格一样，还包含一段poly-A。该抗体复合物和细胞共培养后，细胞表面就会连上一些抗体，某种蛋白分子越多，连上的抗体就会越多。过流式之后，裂解细胞，断开二硫键，此时细胞内的RNA和抗体复合物来源的序列都会连到磁珠上，像右下图那样，这两种类型的序列长度不同，可以分开建库，调整核酸浓度，以确保两者都有合适的测序深度。

所以这样一种技术，除了提供转录组的信息，还提供了部分蛋白的信息。正如作者所说，多模态数据应用得越来越多。
支持cite-seq的R包去年看的时候，我知道有Seurat和CiteFuse，CiteFuse今年发表在Bioinformatics。

2. Cell Hashing

Cell Hashing和CITE-seq的测序原理基本一样，只是换了一个应用场景。它解决的问题是：如何将不同样本的细胞混起来测序（便宜），测完了还能区分哪个细胞来源于哪个样本，这样做也减少了批次效应。

标题里面提到了doublet检测仅针对来源于两个样本的doublet，不是指不同cell type的doublet。

背景中提到了另一种解决这类问题的方案就是提供样本的遗传多态性信息（单细胞数据比对后也能得到部分信息，和已知的样本信息比较，就能知道细胞来源于哪个样本了），当然这个信息不那么容易获取。

如图，不同的样本有不同的antibody barcode。

实验过程如上图，在选择抗体时，尽量选择普适的抗体，比如CD45，免疫细胞都表达。是用一种还是多种无所谓（原文用了4种，CD45, CD98, CD44, and CD11a），只要保证antibody barcode与样本对应即可。

原文提供了针对cell hashing数据的拆分方法，这是对应的两个图。B图中的一个点和C图中的一列表示一个液滴(或者理解为一个cellular barcode)。正常情况下，一个液滴里面只有一个细胞，那么对应的样本tag (HTO) 只有一个，也就是只有一个tag有UMI，其他tag的UMI应该为0，不然就是doublet或者空的液滴(negative)。

3. Cell Hashing测序的拆分原理

通常我们在完成测序数据比对后，能得到一个表达矩阵，行为gene列为细胞，而cell hashing的数据，比对后得到的是行为gene+tag，列为细胞。上图给出的tag x cell的一个例子，我们利用的是这个矩阵来判定每个细胞属于哪个样本。

第一步是对UMI矩阵标准化，式子里的i表示第几行，n表示样本(tag)的总数；
第二步是粗分类，最后一类要么是8个UMI都很高，要么都很小；

第三步，假设第9类细胞的tag x cell矩阵每一行都服从负二项分布，根据观测值拟合之后，求0.99分位数，据此来判断某一个值是positive还是negative;
第四步，一列一列看，如果只有一个positive，说明是有效的CB，根据较大的HTO归到对应的样本里去；两个或多个positive则是doublet；没有positive则是空液滴。

预告

下篇写如何从测序数据得到表达矩阵，普通10X以及cell hashing数据都适用
下下篇写cell hashing数据拆分实战，用seurat和citefuse两种方法

因水平有限，有错误的地方，欢迎批评指正！

最后编辑于：2020.12.27 23:56:39

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,905评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,140评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,791评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,483评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,476评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,516评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,905评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,560评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,778评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,557评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,635评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,338评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,925评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,898评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,142评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,818评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,347评论 2赞 342

单细胞分析实录(1): 认识Cell Hashing

1. CITE-seq

2. Cell Hashing

3. Cell Hashing测序的拆分原理

推荐阅读更多精彩内容