今天继续学习上一期的散点图如何优化。
在前面的一个例图中, 在ggplot()函数中将color和fill映射到了continent变量, 使得不仅散点颜色代表了不同大洲, 还使得每个大洲单独拟合了曲线。 如果希望所有大洲拟合同一条曲线怎么办?在必要时, 可以在geom_xxx()函数中用mapping = aes(<...>)单独指定变量映射。 例如, 下面的程序在geom_point()中将不同大洲映射为不同颜色, 而不影响geom_smooth()中的颜色以及分组:
p<-ggplot(data=gapminder,mapping=aes(x=gdpPercap,y=lifeExp))p+geom_point(mapping=aes(color=continent))+geom_smooth(method="loess") +scale_x_log10(labels=scales::dollar)
## `geom_smooth()` using formula 'y ~ x'
也可以将一个分类变量映射到不同绘图符号。 例如,取gapminder 2007年数据子集, 将大洲映射到符号(shape):
library(dplyr)p<-ggplot(data=filter(gapminder,year==2007),mapping=aes(x=gdpPercap,y=lifeExp,shape=continent))p+geom_point(alpha=0.4,size=4)+scale_x_log10(labels=scales::dollar)
这种映射仅适用于点数比较少的情况, 还用了size参数指定符号的大小(单位:毫米)。 如果所有点使用同一符号并需要指定符号, 可以在geom_point()中用shape参数指定, 可以用0到25的整数值表示, 比如19为实心点, 也可以用字符串符号名称表示, 如"circle"表示实心点。 参见ggplot2帮助目录中的vignette ggplot2: ggplot2-specs。注意, 绘图时参与映射的分类变量会自动产生分类效果, color映射与fill映射到分类变量时常常会起到与添加group维相同的作用, 但为了逻辑清晰起见, 需要分组时还应该显式地映射group维。
也可以将连续变量映射为渐变色。 除了表示二元函数的等值线图以外这种方法并不利于读者认读。例如, 将人口数取自然对数映射为渐变色:
p<-ggplot(data=gapminder,mapping=aes(x=gdpPercap,y=lifeExp,color=log(pop)))p+geom_point() +geom_smooth(method="loess") +scale_x_log10(labels=scales::dollar)
## `geom_smooth()` using formula 'y ~ x'
这里不同散点的颜色是连续变化的, 右侧的图例仅显示了有限的一些代表值。
如果使用Rmarkdown制作图文, 图像会自动进入编译的结果(如PDF、Word、HTML)中, 图像大小、输出大小可以用Rmarkdown的设置调整。为了将最近生成的图形保存为PNG格式,用命令如
ggsave(filename="文件名.png")
## Saving 6.6 x 6.59 in image## `geom_smooth()` using formula 'y ~ x'
保存为PDF格式:
ggsave(filename="文件名.pdf")
## Saving 6.6 x 6.59 in image## `geom_smooth()` using formula 'y ~ x'
可以将制作的图形保存到了一个R变量中, 在ggsave()中可以用plot=参数指定,如
ggout01<-p+geom_point()ggsave(filename="文件名.pdf",plot=ggout01)
## Saving 6.6 x 6.59 in image
在ggsave()中可以用scale =指定放大比例, 用height =指定高度, 用width =指定宽度,用units =指定高度和宽度的单位,如:
ggsave(filename="文件名.pdf", plot=ggout01,height=12, width=8, units="cm")
单位可以是in, cm, mm。