10xgenomics单细胞定量软件 ||cellranger 4.0 新特性

单细胞数据分析工具的特点:

  • 集成化:端到端的解决方案
  • 商业开源:上游公司引领工具开发
  • 数据驱动:几乎都是从表达谱做起
  • 迭代快:版本更新,新工具依然增长快
  • 教程完备:step by step 的分析演示

以至于单细胞数据分析上手很快,但是随即迷茫期。当我们说着这样的话,cellranger升级到了4.0.

对于表达谱和Feature Barcode 技术

1 Cell Ranger 4.0中提供了靶向基因表达分析,在运行cellranger count命令时通过指定--target-panel选项调用该分析。

2 Cell Ranger 4.0引入了新的targeted-compare管道,用于直接比较分析匹配的亲本全转录组扩增(Whole Transcriptome Amplification , WTA)和靶向基因表达数据集。

3 Cell Ranger 4.0包括新的targeted-depth子命令,根据输入的WTA结果和相关的panel 文件估计适合于目标基因表达实验的测序深度。

4 人类和小鼠的参考基因组已从3.0.0版本更新到2020A版本:

  • 转录组注释信息从Ensembl 93更新为GENCODE v32 (human)和vM23 (mouse),相当于Ensembl 98。
  • GRCh38和mm10序列不变;染色体名称现在遵循GENCODE/UCSC惯例(例如,chr1和chrM),而不是Ensembl惯例(1和MT)。
  • 新的过滤条件。删除了不可靠注释的基因,这些注释经常会重叠更多的合法基因(详细信息请参阅构建脚本),从而提高了整体灵敏度。2020A向后兼容Cell Ranger 3.1.0和之前版本。

由于更全面的注释和改进的人工基因干预,定位率和基因/UMI敏感性得到提高:



5 在分析3’基因表达数据时,Cell Ranger 4.0在将reads与参考转录组比对之前,对Read-2的5’末端oligo (TSO)序列和3’末端的poly-A序列进行修饰。此行为与Cell Ranger 3.1不同,后者不执行任何修剪。

一个全长cDNA分子的侧面通常有一个30 bp的TSO序列,aagcagtggtatcaacgcagagagtacatggg,在5'端和3'端多聚A序列。根据库的片段大小分布,一些序列reads被期望包含其中一个或两个序列。与长RNA分子相比,短RNA分子更可能包含TSO和poly-A序列或两者兼而有之。由于TSO或poly-A形式的非模板序列的存在,使得read映射的比例增加了1.5%,因此修剪可以使基因比对更好。修边提高了分析的灵敏度,也提高了pipeline的计算效率。输出BAM文件中的标签ts:i和pa:i表示从Read-2的5'端修剪的TSO核苷酸的数量和从3'端修剪的poly-A核苷酸的数量。修剪过的碱基存在于BAM记录的序列中,并被记录在 CIGAR字符串中。

下面,我们将说明,对于不同的样本类型,对于修剪和未修剪的比对,映射到转录组的reads片段如何作为读取长度的函数而变化。

6 Cell Ranger 4.0增加了对“un-tethered”特性条形码模式的支持,(BC)没有锚,在 Feature Reference CSV中指定。此选项允许用户指定特性条形码的序列,而无需指定读取时序列所期望的位置。

7 cellranger reanalyze现在输出分析中使用的计数矩阵,以便反映所使用的任何细分条形码。

8 修正了mkref输出GTF文件的错误。这些更改不会影响管道结果。

9 修正了BAM文件的错误

  • PCR重复reads和低支撑UMI reads (xf:i:2)的二次比对(flag 0x100)正确设置了重复标志(0x400)
    + 低支持的UMI读取(xf:i:2)在UB:Z有正确的条形码。以前,它包含原始条形码。

10 BAM 文件改变

  • Cell Ranger 4.0不会输出li:i标记。RG:Z标签包含此信息。
  • Cell Ranger 4.0不会输出BC:Z和QT:Z标签

Gene Expression, Feature Barcode, and V(D)J 都有的变动

  1. mkfastqsupports dual-indexed libraries for gene expression, both WTA and Targeted, V(D)J, and Feature Barcode datasets.
  2. mkfastq supports a new sequencing configuration for Novaseq where the I2 index may need to be reverse-complemented before demultiplexing dual-indexed libraries.
  3. count and vdj run approximately two to four times faster than in Cell Ranger 3.1, depending on the sequencing data, and reduces disk I/O by half.
  4. A new command-line interface with improved error-handling has been engineered into Cell Ranger 4.0.
  5. The Martian pipeline framework has been upgraded to version 4.0. mrp andmrjob will shut down if they detect that their log files were deleted or renamed. See the Martian release notes for more details.
  6. The following features present in Cell Ranger 3.1 are no longer present in Cell Ranger 4.0:
    • mkfastq no longer supports data from the Single Cell 3′ v1 chemistry.
    • The cellranger demux subcommand has been removed.
    • The command-line interface does not accept FASTQs created by the deprecated cellranger demux pipeline. If you need to process FASTQs in this layout, contact support@10xgenomics.com for assistance.
    • cellranger count and cellranger vdj are no longer able to process data from multiple gem-wells through manual editing of MRO files.
    • The Single Cell 3′ v1 and Single Cell 5′-R1 assay configurations will no longer be autodetected in Cell Ranger 4.0. Users who want to analyze data from those chemistries must explicitly specify the chemistry (SC3Pv1 or SC5P-R1 respectively) using the --chemistry argument.

V(D)J 分析的变化

1 参考基因组的变化。

  • 在某些情况下移除C区域的第一个基底。在这些情况下,我们观察到在大多数转录本中,J区和C区恰好重叠一个碱基。
  • 添加一个IGHJ6等位基因到人类的VDJ参考序列。

2 修复了contig注释中的Bug:
如果引用D区域与contig完美匹配,则用该D区域注释该contig。
3 The command line argument --chain is added back in 4.0 for rare cases when the automatic chain detection fails.

4 A new output airr_rearrangement.tsv is added, which contains annotated contigs of VDJ rearrangements in the AIRR TSV format.

5 The VDJ reference is copied to the outputs folder starting with Cell Ranger 4.0.

release-notes

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343