数据准备
本示例数据是自编数据,仅为练习所用,数据结构假设为,两个年份year(2020,2021),两个氮水平nitrogen(N1,N2),两个玉米品种variety(a,b)测定了5个试验指标(变量v1,v2,v3,v4,v5),每个处理3次重复block(1,2,3)。
library(tidyverse) # 调用tidyverse。
df <- read_csv(file = "df.csv") # 导入数据。文档在工作目录下,所以直接给文件名导入。
df # 查看数据。
## # A tibble: 24 × 9
## year nitrogen variety block v1 v2 v3 v4 v5
## <dbl> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2020 N1 a 1 1.26 2.14 0.4 5 3.25
## 2 2020 N1 a 2 1.2 2.9 0.1 5.3 1.27
## 3 2020 N1 a 3 1.3 3 0.3 5.6 2.24
## 4 2020 N1 b 1 1.08 1.72 1.8 2.8 1
## 5 2020 N1 b 2 1.05 1.65 1.7 2.5 3.12
## 6 2020 N1 b 3 1.15 1.35 1.5 3.1 4.57
## 7 2020 N2 a 1 1.32 3.78 1.6 6 5.85
## 8 2020 N2 a 2 1.28 4.32 1.4 6.1 6.48
## 9 2020 N2 a 3 1.35 3.95 1.3 6.2 7.21
## 10 2020 N2 b 1 1.33 3.47 2.8 4.1 6.56
## # … with 14 more rows
7.2 标度(scale)
标度(scale)
标度是将数据空间(标度的定义域)映射到图形属性空间(标度的值域)的一个函数。
标度的作用是调整数据映射的图形属性。这些属性包括颜色,位置,形状,大小,线条类型等。
ggplot2为每一种图形属性提供了一个默认的标度,当默认标度不满足我们的作图需求时,我们需要对默认标度进行修改。
标度变换
要想将图形属性映射为变量,需要在函数aes()中将图形属性名称和变量名称关联起来。ggplot2会自动为每个变量值分配唯一的图形属性水平,这个过程即为标度变换。
通常ggplot2会自动根据输入变量选择最优的坐标刻度方案,若要手动设置或调整,就需要用到标度函数:scale_<MAPPING><KIND>(),标度函数构成是scale图形属性名称_标度名称,如:scale_color_gradient表示对图形颜色的渐变色进行定义。
标度分类
按照对图形作用的部分差异,分为坐标轴标度,颜色标度,填充标度,大小标度,透明度标度,线条标度,形状标度。
常用的标度函数:
- scale_x or y_continuous():用于修改连续变量坐标轴的刻度和标签。
- scale_x or y_discrete():修改离散变量坐标轴的标签。
- scale_x or y_date():设置日期刻度。
- scale_x_log10(), scale_x_sqrt(), scale_x_reverse():坐标刻度取对数,开方,翻转。
- scale_x_gradient(), scale_x_gradient2(), scale_x_gradientn():渐变色设置,x可为 color, fill 等。
7.2.1 坐标轴设置
坐标原点归位
你会发现,ggplot2绘制的初始图形,坐标原点均不是从0开始,可通过以下方式调整。
library(tidyverse) # 调用tidyverse包。
df <- read_csv("df.csv") # 读取df数据集。
p <- ggplot(df, aes(v1, v2)) + geom_point() # 绘制基础图形,定义为p。
p # 显示图形。
p + coord_cartesian(xlim = c(0, NA), ylim = c(0, NA)) # 坐标原点归位。
p + expand_limits(x = 0, y = 0) # 结果同上。
p + xlim(c(0, 1.5)) + ylim(c(0, 4.5)) # 也可以通过设置坐标轴刻度范围让起始刻度从0开始。
设置坐标轴范围
- 通过coord_cartesian()设置xlim和ylim。
- 通过xlim(c(轴范围最小值,轴范围最大值))和ylim(c(轴范围最小值,轴范围最大值))。
- 通过scale_y_continuous(limits =c())设置。
p + coord_cartesian(xlim = c(0, 1.5), ylim = c(0, 4.5)) # 通过coord_cartesian函数中的xlim和ylim控制x轴和y轴的取值范围。
p + xlim(c(0, 1.5)) + ylim(c(0, 4.5)) # xlim和ylim设置轴取值范围。
p + scale_x_continuous(limits = c(0, 1.5)) + scale_y_continuous(limits = c(0, 4.5)) # scale_x or y_continuous(limits = )调整轴取值范围。
坐标轴翻转
coord_flip(xlim = NULL, ylim = NULL, expand = TRUE)
实现坐标轴翻转,即 x 轴与 y 轴互换。
ggplot(df, aes(nitrogen, v1)) + geom_col() # 基础图形。
ggplot(df, aes(nitrogen, v1)) + geom_col() + coord_flip() # 翻转坐标轴。
scale_x_reverse或scale_y_reverse
实现的是x轴或y轴取值范围最大最小值的翻转。
p + scale_x_reverse() # 原来x轴最大值翻转至坐标左下角原来最小值的地方。
p + scale_y_reverse() # 原来y轴最大值翻转至坐标左下角原来最小值的地方。
坐标轴比例缩放
coord_fixed(ratio = 1, xlim = NULL, ylim = NULL, expand = TRUE)
参数ratio用于指定纵横比,也就是纵轴1单位显示的长度,是横轴1单位显示的长度的几倍。 默认值为1,表示x 轴和 y 轴之间的缩放比例为 1:1。 ratio值越小,图形越扁。
p # 基础图。
p + coord_fixed() # coord_fixed()函数调整纵横比为1:1。
p + coord_fixed(ratio = 2) # 纵轴单位显示长度是横轴单位显示长度的2倍。
p + coord_fixed(ratio = 1/2) # 纵轴单位显示长度是横轴单位显示长度的0.5倍。
p + coord_fixed(ratio = 1/10) # 纵轴单位显示长度是横轴单位显示长度的0.1倍。
p + xlim(c(0, 5)) + ylim(c(0, 5)) + coord_fixed() # 这里将横轴和纵轴的刻度范围设置成了一样,再调整坐标轴比例为1:1。
更改分类轴项目顺序
scale_x_discrete()或scale_y_discrete():实现图形分类变量顺序变更。
ggplot(df, aes(nitrogen, v1)) + geom_boxplot() # 基础图绘制。
ggplot(df, aes(nitrogen, v1)) + geom_boxplot() + scale_x_discrete(limits = c("N2", "N1")) # 调整了x分类变量顺序。
df$nitrogen <- factor(df$nitrogen,levels = c("N1", "N2"), order = TRUE) # 先设置df数据集nitrogen为因子,因子水平为N1和N2,让因子顺序为N1和N2。
df$nitrogen # 查看因子。
ggplot(df, aes(nitrogen, v1)) + geom_boxplot() + scale_x_discrete(limits = rev(levels(df$nitrogen))) # 反转因子顺序。
坐标轴坐标转换
scale_x or y_log10():对x轴或y轴做对数转换。
scale_x or y_sqrt():对x轴或y轴数值取平方根。
p + scale_x_log10() # 对x轴数值取对数。
p + scale_x_sqrt() # 对x轴数值取平方根。
参考资料
- R语言编程—基于 tidyverse,张敬信,人民邮电出版社(待出版),2022.
- R语言教程,李东风,https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/index.html
- 《R数据科学》,人民邮电出版社,2018.
- ggplot2高效实用指南,https://www.jianshu.com/p/2dc81b91131e
- ggplot2超详细讲解,https://www.jianshu.com/p/07f7931a00db
- ggplot保姆级教程-科研绘图细节调参,https://zhuanlan.zhihu.com/p/391832351
- 第 23 章 ggplot2之标度,王敏杰,https://bookdown.org/wangminjie/R4DS/tidyverse-ggplot2-scales.html
- R|ggplot2(三)|coord系列函数坐标轴转换,https://zhuanlan.zhihu.com/p/29553382