14.1 简介
函数是R中重要的组成部分,也是成为一个熟练使用R的科研工作者必备的技能。本章将为大家介绍关于R函数的部分。
函数具有以下三个优点:
- 可以给函数命名一个有意义的名字,这样可以让代码看起来更加清晰明了;
- 如果需要修改代码,这样仅需修改一处即可,无须修改多处;
- 消除复制粘贴过程中的无心之失,可以减少因为看错或者想错所带来的失误。
函数具有风格性和简洁性
一个好的函数是可以让读者可以读懂,并且可以进行操作。所以必要的注释是必不可少的。
14.2什么时候应该使用函数
在书中,作者举了一个关于简单数值计算的例子。
简单解释一下书中的函数及参数
- tibble函数 是可以创建一个数据框或者一个list;
- na.rm 参数 a logical indicating whether missing values should be removed.
那么这个代码就很明了了 意思就是将每列的值调整为0-1之间。也就是这个是将数据进行 正则化(regularization)(x-min/R)
- 极差的英文是Range,所以后文中用了这个函数。
- Range函数会返回两个值,也就是最大值和最小值。因为极差就是最大值减去最小值。
如果你上述的信息都理解了,我相信对于P187页的函数你也能理解了。如果不知道0,5,10如何计算出的返回值,你可以像我一样将X值带入进上述的函数。这样你不仅会理解了函数,也会理解了运算的过程。
创建函数需要以下三个重要组成
- 一个函数名称 也就是<-左边的名称
- 一个或者几个输入参数,像书上的函数里面就一个输入值 那就是df$a
- 还需要一个函数体,也就是计算参数的代码
人与计算机函数
这块主要是讲函数名称的命名、规范及易读性。
- 切记名字太短,或者使用acbc等命名
- 使用简单的—将名字隔开,使名字更加清晰
- 表达清楚所写函数的意义
if函数的使用
if(condition) {
条件为真时执行的代码
} else{
条件为假时执行的代码 }
注意 condition应该返回值为T or F 不应该为NA或者一个向量
简单使用一下
> x=10
10
if (x>0){
x=x+1
} else{
print(x)}
> x
[1] 11
升级版
> has_name <- function(x) {
+ nms <- names(x) #查看数据的名字
+ if (is.null(nms)) { #判断nms是不是null值
+ rep(FALSE, length(x)) 如果是则复制FLASE 重复x个
+ } else {如果不是
+ !is.na(nms) & nms != "" 则判断nms是不是缺失值和是不是等于空值
+ }
+ }
多重if值的跟这个差不多,不过if循环的太多你就该考虑换个函数了!
函数参数
函数参数要写的完整,要选择有意义的参数名称,尽量选择缩写。