单细胞测序数据量和捕获细胞数对数据结果影响大吗?

任何测量都要考虑精度和通量的问题,生物测量亦如此。当测序成本受到限制时,通常需要在较大的细胞数 & 较小数据量和较小的细胞数 & 较大数据量之间进行权衡,那对于单细胞测序来讲,细胞数和测序数据量对于分析结果有何影响呢?

2016 年 Heimberg et al 开发了一个公式,评估测序数据量对测序样本区分能力的影响(测序数据量对主成分再现度的影响)。研究人员选择了 19 个不同小鼠转录组数据(平均测序数据量 107 reads),分析发现 1% 的测序数据即可有效区分样本(图 1)。具体而言,当测序数据量达到 55,000 reads/ 样本时,前三个主成分(PC1、PC2、PC3)再现度超过 80%,而若使前九个主成分均达到 80%的准确度,则需要 145,000 reads,进一步增加测序深度对主成分精度的贡献会递减。

image

单细胞转录组测序的核心分析内容构建细胞图谱,区分不同细胞类型,类似于 Bulk RNA-seq 中的样本 PCA 分析。为了分析测序数据对细胞类型区分的影响,Heimberg 选择了 Zeisel et al 于 2015 年发表在 Science 的文章的数据(3005 个大脑皮质和海马区细胞,15000 unique trans/cell)进行了分析。使用相同的公式,发现测序数据在1000 trans/cell 情况下,前三个主成分的再现错误率分别是 11%、22% 和 38%(图2A)。进一步验证发现,当数据量只有 100 trans/cell 时,即可有效区分少突胶质细胞和两类锥体神经元,准确度 >90%。而当数据量达到 1000 trans/cell 时,不仅可以区分少突胶质细胞和两类锥体神经元,还能够将两类椎体神经元(海马锥体神经元和皮层锥体神经元)区分开,准确度 >90%(图 2B)。

image

Heimberg et al 的结果表明,低测序深度情况下可以实现样本分群 / 细胞聚类。而为了进一步分析测序数据量和细胞数对细胞聚类的影响,10X 官方设置了不同测序数据量和细胞数对 PBMC 主要细胞类型检测的实验:

1、对 4000 个 PBMC 细胞测序,平均测序数据量为 50K reads/cell;

2、随机抽样设置不同测序深度:500、1K、2.5K、 5K、 7.5K、10K、 15K,、25K和 50K reads/cell;

3、随机抽样设置不同细胞数:100、200、400、600、800、1K、2K、 3K 和 4K细胞

测序深度的影响

此次评估过程采用的是 10X Genomics 单细胞转录组 V2 试剂,V2 试剂建议的最低测序数据量是 50K reads/cell,通过图 3 可知,当平均测序数据达到 50K reads/cell 时,测序饱和度、检测到的转录本数量 / 细胞、基因数量 / 细胞以及总基因数基本饱和,表明官方推荐数据量足够数据分析。

image

对于检测细胞数,低测序数据量(平均 506 reads/cell)和高测序数据量(平均86503 reads/cell)相差不大,检测到细胞数分别是 4273、4353,但是两种测序深度下,检测到的基因中位数差别很大,分别是 160、1234(图 4)。

image

尽管低测序深度时部分指标灵敏度较低,但是通过 graph-based 聚类依然推定了不同细胞亚群,t-SNE 聚类图见图 5A。基于 CD3D、CD3E 鉴定 T 细胞 ; GNLY、NKG7 鉴定NK 细胞 ; CD79A、CD79B 鉴定 B 细胞;CD14、FCGR3A 鉴定单核细胞(图 5B)。

image

在细胞聚类和鉴定基础上进一步分析,不同测序深度范围内,四种细胞类型(T 细胞、NK 细胞、B 细胞、单核细胞)分类准确度范围为 93-99%(图 6A、B),当测序深度达到 2.5K reads/cell 时,细胞类型分类准确度达到 98% 并且相对一致。当测序深度降低到500 reads/cell 时,相比饱和测序数据量,细胞类型分类准确度降低幅度(7%)远远低于转录本中位数 /cell(94%)、基因中位数 /cell(87%)和总基因鉴定数(33%)的降低幅度。

image

另 外,2019 年 发 表 在 Circulation 上 的 文 章“Single-Cell Analysis of the Normal Mouse Aorta Reveals Functionally Distinct Endothelial Cell Populations”在设计实验室 比较了不同测序深度对细胞聚类的影响,4 个主动脉样本中,2 条主动脉样本测序深度低 (17,000 reads/cell),2 条主动脉样本测序深度高 (145,000 reads/cell),分析得到的细胞数量二者之间无差异。

image

以上数据说明,单细胞转录组测序在官方推荐的数据量下(V2 试剂,官方推荐数据量 50K reads/cell;V3 试剂,官方推荐数据量 20K reads/cell),分析获得的各项指标:细胞检测数、测序饱和度、转录本、基因检测饱和度以及检测基因总数均可以达到饱和,当然考虑到单细胞悬液制备时可能会存在细胞碎片等背景干扰,占用一部分数据,可以在选择测序数据量时,对测序数据量进行加倍(例如 5000 个细胞官方推荐最低测序数据量为30G,实际测序可以测60G),但是也不需要加测太多数据,因为加测太多数据得到的收益(例如提高测序饱和度等)增幅远低于付出的测序成本。

细胞数量的影响

为了评估捕获得到的细胞数对细胞类型分类准确性的影响,在每个读取深度基础上按照 100-4000 个细胞进行二次取样。在测序深度为 50K reads/cell 时,不同细胞数量下细胞类型分类准确性范围为 82-99%(图 6C)。当细胞数是 1000 时,精确度变化幅度为10%(87-98%),而在 100 个细胞时,准确度估计值为 55-92%,表明随着细胞计数的减少,细胞分类准确度变异性增加。综合测序数据量和细胞数,可知在低细胞数情况下,随着测序深度增加,细胞类型分类准确度依然维持在较低水平,但在低测序深度情况下,细胞类型分类准确度可以随细胞数量增加而增加,表明细胞数对细胞类型分类准确度的影响大于测序深度。

参考文献

Heimberg, G., Bhatnagar, R., El-Samad, H., & Thomson, M. (2016). Low Dimensionality in Gene Expression Data Enables the Accurate Extraction of Tranional Programs from Shallow Sequencing. Cell Systems, 2(4), 239–250. doi:10.1016/j.cels.2016.04.001.

Kalluri, A. S., Vellarikkal, S. K., Edelman, E. R., Nguyen, L., Subramanian, A., Ellinor, P. T., … Gupta, R. M. (2019). Single Cell Analysis of the Normal Mouse Aorta Reveals Functionally Distinct Endothelial Cell Populations. Circulation.doi:10.1161/circulationaha.118.038362.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容