向量(vector)是R语言最基本的数据类型。向量中的元素必须为同一属性,常见的向量类型有数值型向量、字符型向量和逻辑型向量。
由于内容有点多,将分三个博客来讲解,这篇博客主要讲向量的创建、向量的属性、向量元素的访问以及向量元素的修改。
1. 创建向量
在R中,使用c()
函数创建向量是最常用的方式。比如,下面的代码设定数值向量ages
的内容为6个小孩的年龄4,7,6,5,6和7:
> ages <- c(4, 7, 6, 5, 6, 7) ## 数值型向量
这里的c(......)
函数会把它所有的参数首尾相连而形成一个向量,其中函数可以传入任意数量参数。
函数名称“c”是单词"combine"的首字母,有“结合”的意思,很形象。
函数的参数也可以是向量,比如:
> new_ages <- c(12, ages, 17)
上面代码会在ages向量的前后分别添加12和17,形成一个新向量new_ages
。
若要查看向量内容,可直接输入向量/变量名称:
> ages
[1] 4 7 6 5 6 7
> new_ages
[1] 12 4 7 6 5 6 7 17
用c()
函数也可创建字符型向量和逻辑型向量,比如:
> colors <- c('red', 'black', 'blue', 'yellow') ## 字符型向量
> colors
[1] "red" "black" "blue" "yellow"
> booleans <- c(TRUE, FALSE, TRUE, FALSE, TRUE) ## 逻辑型向量
> booleans
[1] TRUE FALSE TRUE FALSE TRUE
2. 向量的属性
拿到一个向量,你可能会问一些问题,比如:它是啥类型,向量长度多大等等。对于数值型向量,比如,你想知道它的平均值、最大值以及最小值等。
2.1 向量的类型
在R中,可以用class()
函数来查看向量的类型,比如:
> class(ages)
[1] "numeric"
> class(colors)
[1] "character"
> class(booleans)
[1] "logical"
从上面结果可以看出,ages
,colors
和booleans
分别属于数值型、字符型和逻辑型向量。
2.2 向量的大小
向量的大小是指向量中元素的个数,可以用length()
函数来查看:
> length(ages)
[1] 6
> length(colors)
[1] 4
> length(booleans)
[1] 5
上面结果说明ages
,colors
和booleans
向量分别有6,4和5个元素。
2.3 其它
对于数值型向量,可通过一些函数来了解向量中的数值情况,比如:
> ages <- c(4, 7, 6, 5, 6, 7)
> mean(ages) ## 平均值
[1] 5.833333
> max(ages) ## 最大值
[1] 7
> min(ages) ## 最小值
[1] 4
更多有关操作向量的函数将在后续博客介绍。
3. 访问向量中的元素
有时你可能只需要使用向量中的某些元素,这时要用到索引。在R中,[]
来指定索引,索引从位置1
开始。下面来看一些例子:
- 获取向量
ages
的第四个元素
> ages[4]
[1] 5
- 获取向量
ages
的第二、第三和第六个元素
> index <- c(2, 3, 6)
> ages[index]
[1] 7 6 7
或者一步到位:
> ages[c(2, 3, 6)]
[1] 7 6 7
- 访问除第四个元素之外的其它元素
> ages[-4] ## 访问除第四个元素外的其它元素
[1] 4 7 6 6 7
- 访问大于5的元素
> ages[ages > 5] ##通过逻辑运算访问所需元素
[1] 7 6 6 7
注意:元素访问操作不会改变原向量的内容。
4. 修改向量中的元素
我们可以通过赋值运算来改变向量中的内容,比如:
ages <- c(4, 7, 6, 5, 6, 7)
> ages
[1] 4 7 6 5 6 7
> ages[2] <- 10 ## 将向量的第二个元素改为10
> ages
[1] 4 10 6 5 6 7
> ages[ages<=6] <- 3 ## 将向量元素小于等于6的值都改为3
> ages
[1] 3 10 3 3 3 7
> ages <- ages[1:4] ## 将向量截断为只包含前面四个元素
> ages
[1] 3 10 3 3
> ages <- NULL ## 删除向量中的所有元素
> ages
NULL
5. 有名称的向量
上述向量中的元素都没有名称,其实在R中可以给向量中的每个元素命名。
5.1 创建有名称向量
可用c()
函数直接创建有名称向量,比如:
> new_ages <- c(kim=7, rob=6, tony=12) ## 向量元素的名称分别为'kim', 'rob', 'tony',值分别为7,6,12
> new_ages
kim rob tony
7 6 12
对于无名称向量,利用names()
函数可用给向量的每个元素命名,比如:
> ages <- c(4, 7, 6, 5, 6, 7) ## 无名称向量
> names(ages) <- c('bob', 'tom', 'lucy', 'andy', 'sandy', 'joe') ## 向量元素命名
> ages
bob tom lucy andy sandy joe
4 7 6 5 6 7
> names(ages) ## 输出向量名称
[1] "bob" "tom" "lucy" "andy" "sandy" "joe"
5.2 元素访问
对于有名称向量,通过指标和名称都可以访问元素,分四种情况:
ages[i]
:返回向量元素的值和名称ages[[i]]
:只返回向量元素的值ages[元素名称]
:返回向量元素的值和名称ages[[元素名称]]
:只返回向量元素的值
> ages[2]
tom
7
> ages[[2]]
[1] 7
> ages['tom']
tom
7
> ages[['tom']]
[1] 7
5.3 删除元素的名称
利用as.vector()
函数可以删除向量中元素的名称,比如:
> new_ages <- c(kim=7, rob=6, tony=12)
> new_ages
kim rob tony
7 6 12
> as.vector(new_ages)
[1] 7 6 12
R向量的第一部分内容:向量的创建、向量的属性、向量元素的访问以及向量元素的修改就讲到这。
如若有遗漏,后期将会添加至本博客。
感谢您的阅读!想了解更多有关R语言技巧,请关注我的微信公众号“R语言和Python学堂”,我将定期更新相关文章。