10X单细胞(10X空间转录组)肿瘤数据分析之肿瘤进化树

作者,追风少年i

hello,大家好,新的一周,新的开始,脑海里浮现周星驰的一句台词,只有越来越强大,才能越来越童话。

今天我们简单来学习一个简单的内容,肿瘤进化树,先看示例。不过之前大家要先补充一下基础知识,我列在下面,供大家参考。

10X单细胞(10X空间转录组)CNV分析之inferCNVpy

10X单细胞个性化分析之CNV篇

10X单细胞(10X空间转录组)CNV分析回顾之CopyKAT

10X单细胞(10X空间转录组)分析之将单细胞转录组映射到拷贝数进化树(scatrex)

10X空间转录组CNV和速率分析的空间图谱

10X单细胞(10X空间转录组)数据分析之识别肿瘤细胞的CNV分析原理

其中文章10X单细胞个性化分析之CNV篇10X单细胞(10X空间转录组)数据分析之识别肿瘤细胞的CNV分析原理主要讲分析原理,建议大家好好看看。

先来看看范例

文章Single-cell analysis reveals new evolutionary complexity in uveal melanoma,2020年的NC文章。

肿瘤进化树

图片要说明的问题并不复杂,a 和 b图就是简单的CNV事件热图,c图是每一个样本的进化树,上方主干对应的CNV事件,是早期就发生的;下方分枝的CNV事件是后期发生的。其中蕴含的逻辑就是含有某个CNV的细胞占比越多,那么这个CNV就发生得越早;含有某个CNV的细胞占比越少,这个CNV就发生得越晚

文章Single-cell RNA landscape of intratumoral heterogeneity and immunosuppressive microenvironment in advanced osteosarcoma

和上一张图的形式差不多,解读也是一样的,我们今天的目标就是来实现进化树的结果

其中我们需要注意2点

  • 进化树的绘制
  • 长短臂注释的由来

我们先来看看文章中的方法,在文章Single-cell analysis reveals new evolutionary complexity in uveal melanoma中的方法是这样的:

inferCNV and clonality analysis:
“使用 10x 数据”部分(inferCNV,https://github.com/broadinstitute/inferCNV)中的建议,从 Seurat 对象中提取原始基因表达数据。对于每位患者,通过 CD3E 的表达高于平均表达 2 个标准差并且没有 PRAME 和 HTR2B 的表达来选择正常参考细胞(选择reference)。对于 inferCNV 分析,使用了以下参数:“denoise”、默认隐藏马尔可夫模型 (HMM) 设置和“cutoff”值 0.1。为了减少假阳性 CNV 调用的可能性,实施了默认的贝叶斯潜在混合模型来识别每个细胞中改变的后验概率使用阈值的默认值“0.5”过滤低概率 CNV。为了确定每个肿瘤中的克隆 CNV 变化,对 HMM 生成的 CNV 使用了“subcluster”方法。 GRCh38 cytoband information用于将每个 CNV 转换为 p 或 q 臂水平变化,以便根据其位置进行简化。每个 CNV 都被注释为gain或loss。数据转换后,包含相同臂级 CNV 的亚克隆被折叠,树被重组以准确表示亚克隆 CNV 架构。该分析排除了线粒体CNV。对于数据可视化,开发了 UPhyloplot2 (https://github.com/harbourlab/UPhyloplot2) 绘图算法以自动生成肿瘤内进化树。从 inferCNV HMM 子集群 CNV 预测算法策划的臂级 CNV 调用和每个子克隆中的细胞百分比用作输入。为每个样本生成可视化系统发育树的可缩放矢量图形 (.svg) 文件。臂长与细胞百分比加上间隔(圆直径 + 5 像素)成正比。

在文章Single-cell RNA landscape of intratumoral heterogeneity and immunosuppressive microenvironment in advanced osteosarcoma中:

Single-cell copy-number variation (CNV) and clonality analysis:
使用 R 的 inferCNV 包(版本 1.2.2;https://github.com/broadinstitute/inferCNV/wiki)估计成骨细胞和软骨母细胞肿瘤细胞中每个细胞的初始 CNV。计算成骨细胞和软骨细胞肿瘤细胞的CNVs,并以免疫细胞作为参考。在过滤具有 < 2000 个 UMI 的不合格细胞后,使用包括“denoise”、默认隐藏马尔可夫模型 (HMM) 设置和“cutoff”值 0.1 在内的参数执行 inferCNV 分析。为了减少假阳性 CNV 调用,实现了默认的贝叶斯潜在混合模型来识别每个细胞中 CNV 变化的后验概率,默认值为 0.5 作为阈值。为了推断克隆单细胞CNV的变化,应用“subcluster”方法根据HMM生成的CNV值推断子簇细胞。注释gene cytoband information信息,每个 p 或 q 臂水平变化都根据其位置简单地转换为等效的 CNV。每个 CNV 都被注释为gain或loss。数据转换后,包含相同臂级 CNV 的亚克隆被折叠,树被重组以表示亚克隆 CNV 架构。对于数据可视化,遵循了 Durante 等人开发的 UPhyloplot2 算法。 (https://github.com/harbourlab/UPhyloplot2)自动生成肿瘤内进化树。从 inferCNV HMM 子集群 CNV 预测算法策划的臂级 CNV 调用和每个子克隆中的细胞百分比用作输入。

我们希望拿到的结果

图片.png

信息量有点庞大,我们先来一步一步的解析:

首先来看基础的CNV分析参数:
  • “denoise”
  • (HMM) 设置和“cutoff”值 0.1
  • 贝叶斯潜在混合模型来识别每个细胞中 CNV 变化的后验概率,默认值为 0.5 作为阈值
  • 注意其中参考细胞的选择,可以选择免疫细胞

运行实例

library(infercnv)
#1
infercnv_obj = CreateInfercnvObject(raw_counts_matrix="oligodendroglioma_expression_downsampled.counts.matrix",
                                    annotations_file="oligodendroglioma_annotations_downsampled.txt",
                                    delim="\t",
                                    gene_order_file="gencode_downsampled.EXAMPLE_ONLY_DONT_REUSE.txt",
                                    ref_group_names=c("Microglia/Macrophage","Oligodendrocytes (non-malignant)")
                                    )
#2
infercnv_obj = infercnv::run(infercnv_obj,
                             cutoff=1, 
                             out_dir="try2",
                             cluster_by_groups=F, 
                             analysis_mode="subclusters",
                             denoise=TRUE,
                             HMM=TRUE,
                             num_threads=1)

注意两个参数cluster_by_groups=F,以及analysis_mode="subclusters",这个参数最终会将肿瘤细胞分为8个cluster(少数情况是7类,如果实在找不出进一步的差别),每个cluster有各自的CNV模式,如果analysis_mode="samples",则一个样本不同细胞最终预测的CNV模式是唯一的。另外需要注意的是,一般文章放的热图是去噪后的热图,那张图两种模式没什么区别,因为去噪和预测CNV在inferCNV里面是分开的两步。

inferCNV分析完之后,我们一般会得到如下的三个文件:

  • 17_HMM_predHMMi6.rand_trees.hmm_mode-subclusters.cell_groupings包含了根据CNV分类的结果,一共两列,一列是类别名称(1.1.1.1, 1.1.1.2, 1.1.2.1, 1.1.2.2, 1.2.1.1, 1.2.1.2, 1.2.2.1, 1.2.2.2这8类),另一列是细胞编号。这个文件不止包含观测,还有参照,参照对应的行要去掉。

  • HMM_CNV_predictions.HMMi6.rand_trees.hmm_mode-subclusters.Pnorm_0.5.pred_cnv_regions.dat

# cell_group_name cnv_name        state   chr     start   end
# all_observations.all_observations.1.1.1.1       chr1-region_1   2       chr1    14363   145116922
# all_observations.all_observations.1.1.1.1       chr1-region_3   3       chr1    151264273       156182587

第二列是CNV的name,唯一;第一列是CNV所属的group,示例在"subclusters"模式下有7个group;4 5 6列包含CNV的坐标;第三列表示状态:

# State 1: 0x: complete loss
# State 2: 0.5x: loss of one copy
# State 3: 1x: neutral
# State 4: 1.5x: addition of one copy
# State 5: 2x: addition of two copies
# State 6: 3x: essentially a placeholder for >2x copies but modeled as 3x
  • HMM_CNV_predictions.HMMi6.rand_trees.hmm_mode-subclusters.Pnorm_0.5.pred_cnv_genes.dat
# cell_group_name gene_region_name        state   gene    chr     start   end
# all_observations.all_observations.1.1.1.1       chr1-region_1   2       WASH7P  chr1    14363   29806
# all_observations.all_observations.1.1.1.1       chr1-region_1   2       LINC00115       chr1    14363   29806

每一个group(第一列), 每一个CNV片段(第二列)上面每一个基因(第四列)的CNV状态(第三列),文件中基因这一列是唯一的。相当于上一个文件细化到基因层面

需要说明的是,上面三个文件只有第一个文件是画进化树需要的,后面两个文件是为了注释进化树的分枝。

接下来就是要进行长短臂注释了,大家可以看到上述的内容主要是得到了发生CNV的染色体、位置信息以及基因,并没有提到长短臂,这个时候我们就要借助一些方法来注释了,基因的Cytoband格式:

还有 44% 的精彩内容
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
支付 ¥20.00 继续阅读
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,937评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,503评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,712评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,668评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,677评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,601评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,975评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,637评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,881评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,621评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,710评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,387评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,971评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,947评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,189评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,805评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,449评论 2 342

推荐阅读更多精彩内容