circos图在单细胞数据分析中的应用

前情回顾:

Network在单细胞转录组数据分析中的应用
桑基图在单细胞数据探索中的应用
热图在单细胞数据分析中的应用
R-南丁格尔玫瑰图: 人民日报都在用的细胞分群占比图
三元相图怎么看怎么画(附R代码示例)

在数据科学中,我们主要目标是描述元素的对象和属性及其之间的关系。在单细胞数据科学中,上游是在描述元素,如细胞的特性或基因的表达量,下游往往是描述细胞之间或基因之间的关系,如,配受体。关系型数据,即两个或以上变量之间的关系,其可视化是一门技术与艺术的科学。之前我们介绍的网络图,桑基图,热图其实也都是关系型数据可视化的例子,今天,我们再介绍一种常用的关系型数据可视化的工具:圈图,或circos图。

在这之前,我们先来思考一个相对宏观的问题:如何选择可视化工具呢?首先需要对我们的数据进行分类,不同的数据结构可以选择不同的可视化工具,以达成自己想说明的具体问题。

不要被这个导图吓到,它至少告诉我们数据类型是有限的,可视化的方法也是有限的,而不是无限的。好处是,避免了拿到数据手足无措的尴尬。关系型数据的可视化主要的技术有,和弦图,网络图,桑基图,以及它们的变形,如下:

当我们需要对"关系"进一步细化的时候,可以用颜色,面积,粗细等属性来映射不同的数据意义。下面来讲我们今天的圈图,请注意,这里的圈图是广义上的,是包含了和弦图(Chord diagram)的,和弦图往往往往出现在圈图的中心,如下图的ABC:

图D当然是圈图,而其中没有和弦图,在这个意义上,圈图是一种用来描述复杂关系的组合图。由于圈层可以有多个,每个圈层都可以按分类安排一种简单图,如柱形图,折线图,环形图等。来说说圈图中的和弦图先。

和弦图用于探索实体组之间的关系,实体之间的连接用于显示它们共享某些共同点,这使和弦图非常适合比较数据集内或不同数据组之间的相似性。下图很好地反映出,如何将一个二维表映射成一个和弦图:

  • 细胞来源

那么,我们首先想到的应用是多样本聚类后,看每个群中不同细胞的样本来源,我们在曾经用桑基图实现过这个功能,几乎,所有的桑基图都可以绘制成和弦图:

如果这里每个亚群都注释好细胞类型,又是不同部位的PMBC的话,是不是可以反映出细胞的去向与募集情况呢?

  • 受配图对

然后,不同细胞类型之间的特异的受体和配体对关系,如NicheNet所绘制的那样:

外在的六种颜色是六个细胞类型,不同细胞类型之间的受配体对用相同的颜色映射。

  • V-J基因关系

我们知道,在单细胞免疫组库的数据分析中,V基因和J基因也有着对应关系,这时候可以用和弦图来反映V-J 之间的关系:

  • metadata 圈图

在圈图中关键是定义每一圈层的意义,在我们熟悉的Seurat对象中,metadata里的信息每一列都是一个独立的属性,所以我们可以把metadata信息绘制在圈图之中。

#install.packages('circlize')
library(circlize)
library(Seurat)
library(ggraph,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')
library(pbmc3k.SeuratData,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')       
.libPaths()
library(tidyverse)
library(cowplot)
library(clustree,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')
unclass("Seurat")
class("Seurat")


 head(pbmc3k.final@meta.data)
               orig.ident nCount_RNA nFeature_RNA seurat_annotations percent.mt RNA_snn_res.0.5 seurat_clusters
AAACATACAACCAC     pbmc3k       2419          779       Memory CD4 T  3.0177759               1               1
AAACATTGAGCTAC     pbmc3k       4903         1352                  B  3.7935958               3               3
AAACATTGATCAGC     pbmc3k       3147         1129       Memory CD4 T  0.8897363               1               1
AAACCGTGCTTCCG     pbmc3k       2639          960         CD14+ Mono  1.7430845               2               2
AAACCGTGTATGCG     pbmc3k        980          521                 NK  1.2244898               6               6
AAACGCACTGGTAC     pbmc3k       2163          781       Memory CD4 T  1.6643551               1               1

绘制圈图:

pbmc3k.final@meta.data -> df
circos.par("track.height" = 0.1)
circos.initialize(df$seurat_annotations, x = df$nFeature_RNA)
circos.track(df$seurat_annotations, y = df$nCount_RNA,
             panel.fun = function(x, y) {
                 circos.text(CELL_META$xcenter, 
                             CELL_META$cell.ylim[1.3] + mm_y(2), 
                             CELL_META$sector.index)
                 circos.axis(labels.cex = 0.6)
             })


col = rep(c("#FF0000"), length(levels(Idents(pbmc3k.final))))
circos.trackPoints(df$seurat_annotations, df$nFeature_RNA, df$nCount_RNA, col=col,pch = 16, cex = 0.5)
circos.text(1200, 1600, "lab", sector.index = "NK")


bgcol = rep(c( "#CCCCCC"), length(levels(Idents(pbmc3k.final))))
circos.trackHist(df$seurat_annotations, df$nFeature_RNA, bin.size = 20, bg.col = bgcol, col = NA)


circos.track(df$seurat_annotations, x = df$nFeature_RNA, y = df$nCount_RNA,
             panel.fun = function(x, y) {
                 ind = sample(length(x), 10)
                 x2 = x[ind]
                 y2 = y[ind]
                 od = order(x2)
                 circos.lines(x2[od], y2[od])
             })
circos.track(df$seurat_annotations, x = df$nFeature_RNA, y = df$percent.mt,
             panel.fun = function(x, y) {
                 ind = sample(length(x), 10)
                 x2 = x[ind]
                 y2 = y[ind]
                 od = order(x2)
                 circos.lines(x2[od], y2[od])
             })


circos.track(ylim = c(0, 1), panel.fun = function(x, y) {
    xlim = CELL_META$xlim
    ylim = CELL_META$ylim
    breaks = seq(xlim[1], xlim[2], by = 100)
    n_breaks = length(breaks)
    circos.rect(breaks[-n_breaks], rep(ylim[1], n_breaks - 1),
                breaks[-1], rep(ylim[2], n_breaks - 1),
                col = rand_color(n_breaks), border = NA)
})


circos.link("B", c(400, 800), "NK", c(800,1000), col = "red",
            border = "blue", h = 0.2)
circos.link("CD14+ Mono", 400, "FCGR3A+ Mono", c(400,1200), col = "green", border = "black", lwd = 2, lty = 2)


##################
circos.clear()
dev.off()

通过以上的例子,我们可以感受到,圈图也好,和弦图也好,其实都是一个框架,有了这个框架我们就可以在这个上面填充信息。如果说通过数据类型来寻找绘图结构是买毛坯房,那么,给每个绘图元素映射生物学意义就是在装修这个房屋。

不知道,这篇文章有没有启发到你呢?

封面:纽约时报的基因组圈图

https://jokergoo.github.io/circlize_book/book/circos-heatmap.html
https://xgaoo.github.io/ClusterMap/ClusterMap.html
https://yimingyu.shinyapps.io/shinycircos/
https://www.data-to-viz.com/graph/chord.html
http://circos.ca/
https://www.bioconductor.org/packages/release/BiocViews.html#___SingleCell
https://www.r-graph-gallery.com/310-custom-hierarchical-edge-bundling.html
https://davemcg.github.io/post/lets-plot-scrna-dotplots/
https://pxy.shatterspikeneopets.online/dotplot-seurat.html
https://jokergoo.github.io/circlize_book/book/introduction.html#principle-of-design
https://divingintogeneticsandgenomics.rbind.io/post/enhancement-of-scrnaseq-heatmap-using-complexheatmap/
https://gdevailly.netlify.app/post/plotting-big-matrices-in-r/
https://www.jianshu.com/p/0dbdd6733b34

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,311评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,339评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,671评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,252评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,253评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,031评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,340评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,973评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,466评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,937评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,039评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,701评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,254评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,259评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,485评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,497评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,786评论 2 345

推荐阅读更多精彩内容