apply 函数的主要优点是我们可以摆脱循环操作。
r 中的应用族包含 apply()、lapply()、sapply()、mapply() 和 tapply()。
最大的问题之一是如何以及何时使用这些功能?
答案很简单,这取决于数据集的结构以及您想要的结果。
下面我们来一一看看如何执行这些功能。
1. apply()
mymatrix<-matrix(1:9,nrow=3)
mymatrix
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
#Let’s calculate the row sum.
apply(mymatrix,1,sum)
[1] 12 15 18
#Let’s calculate the column sum
apply(mymatrix,2,sum)
[1] 6 15 24
#Let’s create NA value in the matrix and see how we can execute the function.
mymatrix[2,3]<-NA
apply(mymatrix,1,sum)
[1] 12 NA 18
#Insert na.rm function in the above code and see the result.
apply(mymatrix,1,sum,na.rm=TRUE)
[1] 12 7 18
2. lapply()
lapply 返回一个与 X 长度相同的列表,其中的每个元素都是将 FUN 应用于 X 的对应元素的结果。
mylist<-list(A=matrix(1:9,nrow=3),B=1:5,C=8)
mylist
$A
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
$B
[1] 1 2 3 4 5
$C
[1] 8
#Let’s calculate the sum of each list.
lapply(mylist,sum)
$A
[1] 45
$B
[1] 15
$C
[1] 8
你可以看到结果是以列表形式保存的。假设你想得到矢量的结果,只需取消列表即可。
unlist(lapply(mylist,sum))
您可以创建自己的函数并传入该函数。
例如,假设您想将每个元素与值 20 相乘,只需使用以下代码。
lapply(mylist,function(x) x*20)
3. sapply()
sapply 是 lapply 的用户友好版本和包装器,默认返回一个向量、矩阵,如果 simplify = "array",则通过应用 simplify2array() 返回一个数组。sapply(x, f, simplify = FALSE, USE.NAMES = FALSE) 与 lapply(x, f) 相同。
sapply(mylist,sum)
A B C
45 15 8
4. mapply()
m 代表多变量应用。
让我们举个例子,假设我们有四次重复值 1,我们想要在 4 次重复 1,在 3 次重复 2,在 2 次重复 3,在 1 次重复 4。
mapply(rep,1:4,4:1)
[[1]]
[1] 1 1 1 1
[[2]]
[1] 2 2 2
[[3]]
[1] 3 3
[[4]]
[1] 4
让我们创建一个用户定义的函数,看看 mapply 将如何执行。
假设我们有两个向量 x 和 y。
x<-c(A=20,B=1,C=40)
y<-c(J=430,K=50,L=10)
想象一下,如果您要将这两个向量相加并乘以 2。首先,创建函数并将其传递给 mapply。
simply<-function(u,v){
(u+v)*2
}
mapply(simply,x,y)
A B C
900 102 100
- tapply()
tapply(iris$Sepal.Length,iris$Species,max)
setosa versicolor virginica
5.8 7.0 7.9
apply:- 在一个数组的边上应用函数。
lapply:- 在一个列表上循环,在每个元素上评估一个函数
sapply:- 与 lapply 相同,但尝试简单的结果。
mapply:- lapply的多变量版本
tapply:- 在一个向量的子集上应用一个函数。