学习生信的第五天,坚持!加油!
使用事项
- R的赋值符号不是等号,而是<-
- 在Console 控制台输入命令,相当于Linux的命令行
- R的代码都是带括号的,括号必须是英文的。
- 显示工作路径 getwd()
- 向量是由元素组成的,元素可以是数字或者字符串。
- 表格在R语言中改名叫数据框_
- 不要只复制代码,要理解其中的命令、函数的意思。函数或者命令不会用时,除了百度/谷歌搜索以外,用这个命令查看帮助:?read.table,调出对应的帮助文档,翻到example部分研究一下。
数据类型
- 向量(vector)
- 矩阵(Matrix)
- 数组(Array)
- 数据框(Date frame)
- List
- 1、标量与向量的区别
- 标量:一个元素组成的变量
-
向量:多个元素组成的变量,一个向量是一排有序排列的元素。
使用时,一般都会直接给变量定义,也就是“赋值”,字面意思是赋予这个变量一个数值(其实也不一定是数值,还可以是字符串/数据框等等)。
如果把这几行代码都打过了,那么x就被赋值了4次,结果就是,第一次赋值被第二次的覆盖了,第二次的赋值又被第三次的覆盖了,以此类推,以最后一次为准哦。
变量赋值以后,如图所示
在哪看变量,如图所示 - 2、从向量中提取元素
-
(1)根据元素位置
-
(2)根据值
- 3、数据框
注意:数据一定要放在工作目录里,否则报错。 -
(1)读取本地数据
sep,header是比较常用的参数。其中header,一个逻辑值,指示文件是否包含变量名称作为其第一行。 如果丢失,则从文件格式确定该值:当且仅当第一行包含的字段少于列数时,标头才设置为TRUE。;sep,字段分隔符。 文件每一行上的值都用此字符分隔。 如果sep =“”(read.table的默认设置),则分隔符为“空白”,即一个或多个空格,制表符,换行符或回车符。
- (2)设置行名和列名
如果数据框不需要改,却改掉了,可以用刚才的read.table命令重新赋值一遍就可以覆盖掉刚才改错的了。代码是严格区分大小写的。 -
(3)数据框的导出
- (4)变量的保存与重新加载
-
(5)提取元素
- (6)直接使用数据框中的变量
提取某两列作散点图:(提示一下,这里的case和values是两个单纯的列名,没别的意思)
这种方法有个缺点:数据框名a在代码中重复出现。