CSV文件的多种打开方式。
读进R语言,就是数据框,但是修改不会改变原文件。
RMD
https://www.jianshu.com/p/0098baf2df46
rR包帮助文档
少数的R包有 cheatsheets 小抄
还有网页版说明书 browseVignettes(“”)
ls 列出某个包里所有的函数
dir 工作目录下
CSV分隔符 一般是逗号 空格 制表符/t
4.将数据框导出
CSV格式:write.csv()
write.csv(test,file='excample.csv')
comma前面是要导出的数据框的变量名 后面是给导出的文件命名
TXT格式:write.table()
write.table(test,file="exzample.txt")
最好不要覆盖原文件。
5.R特有的数据格式;Rdata
→是R语言特有的数据存储格式,无法使用其他的软件打开。
→存储的是变量。不是表格文件,所以不涉及赋值。
---save()保存--load()加载
save(test,file=“example.Rdata”)
load('example.Rdata')
不能再去赋值了。
常见报错
1.是否放在工作目录下
2.拼写是否正确
3.默认参数不适用于当前读取的文件,也会报错出错。
引号里面直接按TAB键,就能显示工作目录下有的文件名称。
作业
read.table("ex1'',header=T) 这样就有了列名,第一行有了列名。查看帮助文档。
ex2=read.csv()
出现了左上角x --变成了逗号 数据显示不全,只去了小数点后五位
没有别的只能调参数,如何调,查看帮助文档
解决办法
ex2=read.csv("ex2_B cell receptor signaling pathway.csv",
row.names = 1,
check.names=F#不要改名字)
gse=read.table("GSE32575_series_matrix.txt")
Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :
line 31 did not have 2 elements
#为何会报错,还得设置参数,
#!是表格里面的注释文件,设置参数不读取,如果说人工智能哪天取代了写代码的人?自由进化?
#解决办法
gse=read.table("GSE32575_series_matrix.txt",
comment.char = "!",#不要读取注释行
header=T,#正确识别行名
row.names = 1文件第一列是行名)
save(gse,file="ex.Rdata")
load("ex.Rdata")
练习,技巧
如果没有header=T,因为每一列只允许一种数据类型存在,所以数据就变成了字符串类型了。不能进行计算。
查看数据类型,环境里 chr代表字符串类型,不能只靠肉眼观察,要看class结果。字符串为矩阵。
第二种方法:查看矩阵一列,或者一个格子是什么类型。
class(y[,3])
搞清楚是什么样的(矩阵是字符)
读取导出文件的R包
智能读取数据
必杀器iro,行名???
export import
彩蛋
1.生产力工具 谷歌浏览器(沙拉查词,印象笔记,scholarscopoe显示pubmed分数),everything,islide(PPT插件,找老师要编号,),7-zip(压缩,解压),icloud和坚果云(云同步)
2.(曾老师说,如果你要了解相关的领域看五本相关的书或者把一本书看五遍)
书(R数据科学(中英文都看),R语言实战,R语言编程艺术(进阶),R语言之书-编程与统计(前两章) R语言:从数据思维到数据实战(一页一页看下去就能看懂,北大才女))
生信技能树/菜鸟团:论坛,公众号
简书,生信技能树,徐洲更,思考问题的熊,小洁忘了怎么分身
课程:B站-生信树,网易云课堂-四门付费课(B站),哈佛R语言课程(纯文字),统计学课程statquest,哈佛生信科学家的资料大全:唐明 求网站:
三、搜索
搜索引擎大成者:虫部落快搜
搜索有语法:关键词,统计学七支柱 filetye PDF(要求这本书的文件格式为pdf),转录组,site,jianshu
搜狗微信,搜狗知乎,这两个搜索引擎可以看到微信知乎推文,百度看不到微信的,博客(github)。
报错,问答(google,Bing,stack overflow(搜索的天堂))
代码流程:github,公众号,简书
作图代码,作图细节,sthda
尝试和探索,多做记录,敢于分享
全栈工程师,什么都会! 什么都知道!
用输出倒逼输入,让成长有迹可循。markdown