悟已往之不谏,知来者之可追!
《R数据科学》,这是我读完的有关R语言的第一本书。写文章是为了把自己知道的分享出来,这或将为同行(xing)的R语言爱好者提供帮助,也是对自己的一种鞭策,更好的总结R代码,让自己"温故而知新",如果你是R语言的初学者或者生信爱好者可以和我一同了解R语言,也欢迎大家评论,以及对我的不足提出指正,这会让我更好的对待目前这份"工作"。
关于《R数据科学》,你或许对这本书并没有太大印象,但你应该听说过ggplot2,没错,这本书正是ggplot2的R包开发者,哈德利·威克姆(Hadley Wickham)所写。同时他还开发了一些其他著名的软件包,比如,tidyverse,dplyr,purrr,readr等。如果你真的想要比较深入的了解一下ggplot2,我推荐你去看一下这本书。
此次总结的三个方面:准备工作,R包安装;mpg数据框;创建ggplot图形
准备工作,关于tidyverse
tidyverse可以看成是一个囊括了许多R包的"总包",当然也有人戏谑的说它是“旺旺大礼包”,Hadley Wickham把他写的R包放在了里面,方便调取,这意味着你只需要加载tidyverse就可以完成很多工作。
install.packages("tidyverse")
library(tidyverse)
上面是安装和载入的代码,初学者只需要注意,install.packages()中的安装要加双引号。
mpg数据框
mpg是ggplot2包中的数据框,包含了美国环境保护协会收集的38种车型观测数据,现有两种调取方式:
1.直接键入mpg
2.使用ggplot2::mpg来调取
创建ggplot图形
你可以这样写
ggplot(data=mpg)+geom_point(mapping = aes(x=displ,y=hwy))
也可以有省略写法
ggplot(mpg)+geom_point(aes(displ,hwy))
displ是引擎大小,hwy是燃油效率,显示了两者之间的负相关关系。
本次文章的内容只是及其简短的一部分,后续会推荐一些好用的包、软件或者知名公众号,谢谢大家。