R学习|感受ggplot2的魅力—ggplot2复现Nature可视化(四)

抽空接着更新之前的数据可视化。本次主要复现之前这篇文献的图5中的两个图,层级聚类热图和柱状图。主要用到ggplot2的基础绘图功能、pheatmap绘制聚类热图以及complexheatmap绘制层级聚类热图。


Abdel-Hafiz, H.A., Schafer, J.M., Chen, X. et al. Y chromosome loss in cancer drives growth by evasion of adaptive immunity. Nature (2023). https://doi.org/10.1038/s41586-023-06234-x

以下是文章原图。由于这篇文章不能下载全文,所以层级聚类热图里面作者使用的具体的聚类方法、聚类距离等参数就不得而知。这里主要是学习文章中图的复现思路,所以暂时忽略这些问题。第一个层级聚类热图,我们这里用两种方法。第一种是使用corrplot包,基本能复现,唯一的问题是不能添加聚类树;第二种我们使用complexheatmap包复现,基本能达到文章的标准。其实也可以使用pheatmap包,也存在不能添加聚类树的问题。



这个条形图的复现就比较简单了。分别绘制两个panel的条形图,然后使用patchwork组图,共享图例就可以。



首先我们来绘制热图吧,先使用corrplot包。
首先我们加载依赖包
library(readxl)
library(tidyverse)
library(patchwork)
library(corrplot)
rm(list = ls())

然后我们读入数据,并将数据转换为矩阵(输入文件为相关性矩阵,如果是原始的输入形式,首先做相关性检验得到相关性矩阵)。

Figure5a_data <- read_excel("./Source data/Figure 5.xlsx",sheet = "Fig.5a",na="NA")#读入数据
cordata<-Figure5a_data
cordata<-cordata[,-1]
rownames(cordata)<-colnames(cordata)
cordata<-as.matrix(cordata)

自定义一个图例的填充色

col_fun<-colorRampPalette(colors = c("#292cfe","white","#ff1817"))(200) #构建用于绘图的颜色

使用corrplot绘图

corrplot(cordata,
         col = col_fun,#热图颜色
         method = "square",#热图展示方法
         order = "hclust",#相关性矩阵排序方法
         hclust.method = "ward.D2",#层级聚类方法
         addrect = 4,#根据层级聚类添加矩形框数目
         tl.col = "black",#文本颜色
         tl.cex =0.7,#文本大小
         cl.length =5,#图例显示数值数目
         cl.ratio = 0.1)#图例宽度
corrplot层级聚类相关性热图

下面我们看下使用complexheatmap复现的过程。基本过程与corrplot相同。
我们通过使用层及聚类的方法将整个矩阵切割为四行四列。在这个过程中聚类树上会出现虚线,并且会出现对应的行标题和列标题(聚类的cluster)。所以需要设置相关参数不显示聚类树上的虚线以及标题。其他的过程就是进一步对聚类热图进行美化。

library(ComplexHeatmap)
split = data.frame(cutree(hclust(dist(cordata)), k = 4))#根据hclust层级聚类方法将热图分割为4行4列

Heatmap(cordata,
        name = "Correlation",#热图名称
        col = col_fun,#颜色
        row_split = split,#行分割
        column_split = split,#列分割
        show_parent_dend_line = FALSE,#不显示聚类树虚线
        row_dend_gp = gpar(lwd=2),#行聚类树线条宽度
        column_dend_gp = gpar(lwd=2),#列聚类树线条宽度
        row_title = NULL,#不显示行聚类树标题
        column_title = NULL,#不显示列聚类树标题
        border = TRUE,#显示边框
        border_gp = gpar(lwd=2),#边框粗细
        rect_gp = gpar(col="grey"),#热图单元格边框色
        row_names_gp = gpar(fontsize=10),#行名字体大小
        column_names_gp = gpar(fontsize=10),#列名字体大小
        row_dend_width = unit(0.5, "cm"), column_dend_height = unit(0.5, "cm"))#聚类树高度
图5a

下面我们复现图5b。这里我们分别对两个部分进行复现。
首先是不同irAE所对应的不同模型指标得分的条形图。

# Figure 5b1
Figure5b1_data <- read_excel("./Source data/Figure 5.xlsx",sheet = "Fig.5b",na="NA")#读入数据
Figure5b1_data$Type<-factor(Figure5b1_data$Type,levels = unique(Figure5b1_data$Type))#因子化
Figure5b1_data$Metric<-factor(Figure5b1_data$Metric,levels = unique(Figure5b1_data$Metric))#因子化
Figure5b1<-ggplot(data = Figure5b1_data,aes(x=Type,y=Score,fill=Metric))+
  geom_bar(stat ="identity",position = "dodge",width = 0.6,alpha=0.6,color="black")+#条形图
  scale_y_continuous(expand = c(0,0))+#纵坐标原点起始
  theme_classic()+#主题
  labs(x="Type of irAE")+#横坐标标题
  scale_fill_brewer(palette = "Set2")+#设置填充色
  theme(axis.text.x = element_text(angle =30,hjust =0.9),#横坐标文本旋转及对齐
        legend.position = "top")#图例显示位置
Figure5b1

如果横坐标以及图例想跟作者的顺序完全一致,可以自己手动在上面的代码中修改这两个变量的level。
下面复现另外一部分

# Figure 5b2
Figure5b2_data <- read_excel("./Source data/Figure 5.xlsx",sheet = "Fig.5b2",na="NA")#读入数据
Figure5b2_data$Model<-factor(Figure5b2_data$Model,levels = unique(Figure5b2_data$Model))
Figure5b2_data$Metric<-factor(Figure5b2_data$Metric,levels = c("ROC","Accuracy","Average precision"))
Figure5b2<-ggplot(data = Figure5b2_data,aes(x=Model,y=Score,fill=Metric))+
  geom_bar(stat ="identity",position = "dodge",width = 0.6,alpha=0.6,color="black")+
  scale_y_continuous(expand = c(0,0))+
  theme_classic()+
  labs(x="Type of Model")+
  scale_fill_brewer(palette = "Set2")+
  theme(axis.text.x = element_text(angle =30,hjust =0.9),
        legend.position = "top")
Figure5b2

最后拼图即可

Figure5b<-
Figure5b1+Figure5b2+
  plot_layout(widths = c(3,1),#设置图形尺寸比例
              guides = "collect")&#共享图例
  theme(legend.position = "top",#图例位置
        legend.key.size = unit(0.3,'cm'))#图例大小
Figure5b
图5b

今天的复现就到这儿了。最近比较忙,都是抽空更新公众号,后续还会持续更新!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容