此流程比之前的cellranger pipeline相对复杂一些。Cellranger multi可以同时运行转录组数据和免疫组库数据。欢迎讨论。
使用cellranger multi功能分析VDJ和基因表达/Feature Barcode数据
5‘ Chromium 单细胞免疫组库与Feature
Barcode技术可以同时获得VDJ库、细胞表面蛋白、抗原特异性以及基因表达数据。cellranger multi 流程可以并行分析上述多个文库。使用multi流程的优势(相对于分别使用cellranger vdj和cellranger count )在于,它能够在VDJ和基因表达两种数据之间提供更加一致的细胞识别。它包括了如下步骤:
1.在Illumina BCL输出文件夹的基础上,运行cellranger mkfastq,以产生FASTQ文件。
2.在由cellranger mkfastq产生的FASTQ文件基础上,运行cellranger multi
运行cellranger mkfastq
首先,根据cellranger mkfastq的运行说明,产生FASTQ文件。举个例子,如果flowcell的序列号是HAWT7ADXX,那么cellranger mkfastq输出的FASTQ文件将被放在HAWT7ADXX/outs/fastq_path文件夹。
运行cellranger multi
运行cellranger multi可以同时产生一个独立文库的单细胞feature counts, VDJ序列和注释。这需要一个config CSV文件,如下表所述。调用cellranger multi 的参数如下:
Multi 的config CSV文件包含了文库定义和实验配置变量。最多由四个部分组成:[gene-expression], [feature], [vdj], 和 [libraries]. [gene-expression], [feature], [vdj]部分最多有两列,用于配置相应的实验部分。[libraries]部分声明了输入FASTQ文件的位置。10X公司提供了可下载的mulit config CSV文件模板。multi config CSV示例文件可从5.0.0 公共数据集中下载。
设定好上述输入参数后,运行cellranger
经过一系列检查以验证输入参数,cellranger multi流程将开始运行。
默认情况下,cellranger将使用系统所有可用的核,来执行流程。你可以使用- - localcores选项指定不同数量的核,例如,- - localcores=16 将限制cellranger一次最多使用不超过16个核。同样地,- - localmem将限制cellranger使用的内存大小。
这个流程将创建一个新的文件夹,文件夹名称用-- id变量指定(例如/home/jdoe/runs/sample345)。若文件夹已存在,cellranger会将其视为一个已存在的流程,并试图重新运行。
输出文件
成功运行的cellraner multi将出现下列提示信息:
流程的输出文件包含在指定ID的文件夹中(例如sample345)。名称为outs的子文件夹包含主要的流程输出文件:
何时使用multi 流程
基因表达文库代表每个分区(droplet)中的全部聚腺苷酸化mRNA转录本池。TCR或BCR转录本被选择性扩增以创建VDJ文库。因此,基因表达文库相对于VDJ文库而言,更容易检测到包含细胞的分区。如果用multi流程运行基因表达和VDJ数据,那些使用基因表达数据未被识别为细胞的barcodes,将从VDJ数据集中删除。
Cellranger multi中不存在的Features
在cellranger vdj 中可用的- - denovo选项,在cellranger multi中不支持。
Cellranger multi中添加的Features
Cellranger multi 流程支持对每个文库的reads独立进行downsampling,指定速度为0-1之间。它亦允许剪切reads到固定的长度,这个功能在cellranger vdj流程中是不支持的。