R语言学习第二天
日常吐槽
?read.table查看帮助
read.table是要查看的代码
这玩意和jupyter notebook的帮助是类似的啊。。
看了英文才知道R语言的表格和pandas库里面的DataFrame是一个。好嘛,我又孤陋寡闻了。。
向量
一个数字or字符串组成的变量叫做标量
1
"hello"
多个数字or字符串有序排列组成的变量叫做向量
数字or字符串又名元素
c(1,2,3)
c("A","B","C")
1.变量要赋值
RSTDIO里面用alt+-即可快速输入那个坑爹的<-。
看变量这个我看图真的没有找到到底在哪里。。
我按照箭头点的时候发现是打开(小小的吐槽一下,这个图片上的字实在是太小了。)
但是没关系先搜为敬,后来发现我这个本来就有,因为只有值忘记给变量了,所以。就没了
2.从向量中提取元素(根据元素位置或者值大小来选取)
说实话这一部分让我想到了python的列表或者元组。很多类似的代码啊~
- 根据元素位置
x[4] 获取向量x的第四个元素
x[-4] 获取向量除了第四个之外的元素 #这一点和python有很大不同诶,这个还是需要好好记下来
x[2:4] 获取向量第二个到第四个元素 #此处尝试着去写了一下x[:4],python里面是从最开始到第四个值,但是这里面却报错了,看来这个也要注意
x[-(2:4)]这个就比较好理解了,排除2到4的数据外的数据
x[c(1,5)] 输出第一个和第五个元素
2.根据元素值大小
x[x==10] 这个是x等于10的元素
x[x<0] x小于0
x[x %in% c(1,2,3,10,20,50)]
这个就比较牛逼了是在向量c里面的元素,这里面有个高级玩意 %in%,如果给%去掉的话,就会报错。看来是个高级玩意
数据框
1.读取本地数据
a < - read.table(file = "huahua.txt",sep = "\t",header=T)
把数据框赋值给a,期中数据框要读取文件,sep代表分隔符,\t代表tab分隔,header = T 是True的缩写
在此处我发现,尼玛居然报错了,我很是不解,后来敲了getwd(),发现又变C盘了。。
宝宝心里苦
从新敲下setwd()
我要查一下到底怎么永久性改变工作目录
2.设置行名和列名
x<-read.csv('doudou.txt') #新命令读取CSV文件
colnames(x) #读取列名
rownames(x) #读取行名,默认值是行号1234
colnames(X)[1]<-"bioplanet" #给列名第一个变为“bioplanet”
同理也可以给rownames变更名字
简单方法
X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1) #让第一列作为行名
最后一行代码让我很不理解,大写的X变量和小写的x变量来进行比较,神奇的发现第一行居然特么的没了,然后发现行号整个变化了
3.数据框的导出
write.table(变量名,file = "想保存的名",sep = ",",quote=F
sep=',' 分隔符用逗号
quote=F 代表字符串不用双引号,如果T则带,默认为T
4.变量的保存与从新加载
保存所有变量
save.image(file="aaa.RData")
.RData是保存的变量格式
保存单个变量
save(变量名,file="aaa.RData"
再次加载的命令
load("aaa.RData")
5.提取元素
数据框里面的元素和向量里面的元素不同,是个二维的。(我敲的代码都改成了小写x哈哈哈,懒得设置变量名)
x[行,列]
x[行,]
x[,列] 横着写
x[列] 竖着写,这个比较正常
x[列a:列b] 第a列到第b列
x[c(a,b)] 第a列和第b列
X$列名,只能提取一列
行的话,我试了一下,在那个后面加逗号就可以了了
哈哈哈,第五天的学习也结束了see u