R数据可视化2:箱形图 Boxplot

日更已经是不可能的了,让我向周更靠齐。本节我们来讲箱形图(Box-plot)。

什么是箱形图

箱形图(Box-plot)是一种用作显示一组数据分散情况的统计图,因形状如箱子而得名。除了生信领域,该图在其他领域也经常被使用。主要用于反映原始数据分布的特征,并且可以进行多组数据分布特征的比较。箱形图能显示出一组数据的最大值(Maximum)、最小值(Minimum)、中位数(Median)及上下四分位数(1st/3rd Quartile),同时还可以显示逸出值(Outlier)

那么,这些值是如何被计算出来的呢?什么样的数据会被判定为逸出值呢?

第一四分位数(Q1),又称较小四分位数,等于该样本中所有数值由小到大排列后第25%的数字。
第二四分位数,又称中位数,等于该样本中所有数值由小到大排列后第50%的数字。
第三四分位数(Q3)又称较大四分位数,等于该样本中所有数值由小到大排列后第75%的数字。
逸出值,是根据四分位间距(interquartile range)进行计算的:
四分位间距 = Q3-Q1 = ΔQ
在区间 Q3+1.5ΔQ, Q1-1.5ΔQ 之外的值即被视为逸出值。

箱形图怎么画

(1) 需要什么格式的数据
我们需要的数据只要两列,一列为x,一列为y。本次我们使用R中提供的iris数据。

这个数据共有5列,分别为花萼长度(Sepal.Length)、花萼宽度(Sepal.Width)、花瓣长度(Petal.Length)、花瓣宽度(Petal.Width)以及物种(Species)。

比如我们想要探究不同物种的花萼长度差异。

(2) 如何使用ggplot2做箱形图

利用ggplot2画图的核心命令是geom_boxplot。我们先来尝试做一个最最基础也是最丑的boxplot图。

#加载包
library(ggplot2)
#作图
ggplot(iris,aes(x=Species,y=Sepal.Length))+
  geom_boxplot()

可以看到不同的物种之间Sepal.Length有所不同,那么这种差异显著吗?

这个时候我们就需要做检验,那么如何可以直接把检验结果展示在图中呢。这个时候我们可以使用另一个R包ggpubr

#加载包
library(ggplot2)
library(ggpubr)
#作图
ggplot(iris,aes(x=Species,y=Sepal.Length,color=Species))+
  geom_boxplot()+
  theme_bw()+#改变绘图主题
  stat_compare_means(aes(label = ..p.signif..),comparisons = list(c('setosa','versicolor'), c('setosa','virginica'),c('versicolor','virginica')))+#添加检验
  xlab("")#修改横坐标
 


如果将stat_compare_means这部分修改为stat_compare_means(comparisons = list(c('setosa','versicolor'), c('setosa','virginica'),c('versicolor','virginica')))那么默认的作图就不是显示*号而是具体的pvalue值。具体的星号和pvalue的关系如下:
ns: p > 0.05
*: p <= 0.05
**: p <= 0.01
***: p <= 0.001
****: p <= 0.0001

同时如果你的检验是成对的那么可以加上参数paired=T,如果你不想用默认的wilcox.test你可以将method改为其他的。比如我想要做一个成对的t检验:
stat_compare_means(aes(label = ..p.signif..),method="t.test",paired=T)
可以发现这里我没有添加comparisons参数,那么结果就是看三组是否存在两组间有显著差异。
具体的大家可以使用命令?stat_compare_means查看帮助手册。

然后我们还可以修改颜色等等。

#加载包
library(ggplot2)
library(ggpubr)
library(RColorBrewer)
#作图
ggplot(iris,aes(x=Species,y=Sepal.Length,color=Species))+
  geom_boxplot()+
  theme_bw()+#改变绘图主题+
  theme(
    panel.grid = element_blank(),#去掉背景网格
    legend.position = c('none')#去掉图例
  )+
  scale_color_manual(values=brewer.pal(3,'Set1'))+#修改颜色
  stat_compare_means(aes(label = ..p.signif..),comparisons = list(c('setosa','versicolor'),
                                        c('setosa','virginica'),
                                        c('versicolor','virginica')),method="t.test"
                                        )+#添加检验
  xlab("")#修改横坐标

这样,一张简洁的Boxplot图就完成啦。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,189评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,577评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,857评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,703评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,705评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,620评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,995评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,656评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,898评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,639评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,720评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,395评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,982评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,953评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,195评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,907评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,472评论 2 342