学习小组Day6笔记--天天

R语言学习第三天

迟来的作业,因为坑爹的开题报告,话说之前不知道是咨询了哪个龟儿子,告诉老子开题报告就一张纸,不用担心随便写写就可以了。。我。。算了,算了,要淡定。
看到了今日教程,我尼玛这是什么鬼。。准备工作就这么长,宝宝不开心啊。。

准备工作正式开启

1.tidyr包的安装

最近忙于坑爹开题报告,安装tidyr的时候,遇到了个拦路虎,按照教程将rstdio的packages参数更改为国内的什么广州啊,上海啊,一律都是报错,(原谅本宝宝一气之下给IDE关闭了,没办法截图了)都是无法连接URL啊,无法安装啦。。在此时,我突然想到,卧槽,anaconda这一神器当中是用到清华源的,曾经清华源崩了我还换了科大源用了一段时间,那R语言的CRAN实际上也是在清华源上面有的啊。故去查找了一下清华源的切换方法,想用清华源的宝宝看过来~~

首先,用everthing搜索Rprofile。因为之前用anaconda安装过两次RSTDIO,这尼玛我搜到了一大堆的Rprofile,机智的选择了我现在用的这个路径的Rprofile,按照清华源的要求,打开此文档,将下面代码框中的代码放入文档的最后一行,之后保存。重新开启RSTDIO,即可使用清华源来安装包了

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

自从换了清华源,妈妈再也不用担心我不能安装R语言的包了~~哦,不仅仅是R语言,还有python的包也是可以安装的速度搜搜滴。

2.新建数据框

a <- data.frame(GeneId = rep("gene5",times=3),SampleName = paste("Sample",1:3,sep=""),expression=c(14,19,18))

将上述数据输入到rstdio中之后,得到结果,观察a值,发现如下数据框


数据框

根据对上述代码所致结果的拆分,rep=表示的是要重复的值,times是次数,paste是连接字符串,sep=是分隔符。期中这个牛逼的1:3,我们上一次作业已经知道了,是从1到3的这个部分。
那sepression是干啥的呢?是填充无序的数字的例子咯~

3.数据统一化

说实话,我第一次看到tidy的时候,我以为是脏数据(呃。我的英语啊,实在是太差了。)原来是整齐的数据。。正好弄反了。那这个数据统一化呢,作用数据分析的相关处理的小伙伴们都知道是什么啦~再此就不重复了。(其实,是我只能理解,但是无法用语言描述。只可意会不可言传啊。。)

准备工作到此结束咯
天灵灵地灵灵,分割线快显灵。


好了,上面成功的召唤出来了分割线。
一 首先接触的是两个函数
一个是数据统一化的函数:gather
另外一个是让统一化的数据变成不符合统一化的:spread

1.gather 就是变成符合我们的数据统一化的数据函数

gather(数据框,原数据框中的列赋值一个新变量key, 原数据框中的列赋值所有赋值一个新变量value, 指定汇总到一列的列, na.rm = FALSE, convert = FALSE)

na.rm就是是否删除缺失值啦~

那我们之前建立的那个数据表啊,是一个符合的数据表,我们要从新建立一个

X <- data.frame(country=c("a","B","C"),`1999`=paste(c(0.7,37,212),"K"),`2000`=paste(c(2,80,213),"K"))

X长这样


X的样子

之后,我们按照上面的那个gather的内容敲击进去,但是我们发现数据1999前面多了X,那我们也要多敲进去X哦
结果是这样的


结果1

居然还有警告哦~~好高级

2.spread函数
将刚才数据统一化的变成不统一化的。(个人感觉这个函数是将机器容易理解的格式,变成人容易理解的格式)

spread(转换的数据, 增加变量的字段, 需要散开的值, fill = NA, convert = FALSE, drop = TRUE)

fill是缺失值的处理,后面的玩意。。不太清楚啦后面再查~

二 处理丢失的数据
这里面直接用了昨天的doudou.txt数据来作为缺失值的例子
R语言的一大特色就是原生支持excel,比python要好很多啊,所以多用read.csv方便快捷啦~
csv文件的特点是分隔符是, 这个不要忘记就好啦
下面是处理方法函数

  • 整行删除 drop_na(数据框名,有空列的列名)
    宁杀错不放过的删法,只要有空值,一行都清掉,就是drop_na函数啦,人如其名啊。哦不是。是函数如其名。

-同上填充 fill(数据框名,有空列的列名)
这玩意啦。就是直接给上个数字抄下来,就是同上填充啦。

-同列空值填同数 replace_na(数据框名,填充的列名)
第二个比较奇葩啦。一般来说用这个玩意
list(填充的列名=填充的数字)

三 Expand Tables(展开表格?)

  • 补全空值 complete
complete(数据框名,nesting(第一列名),fill = list(第二列名=5))

这玩意和上述的那个,同列空值填同数的方法差不多啦~不过好像可以批量的改诶

  • 列出所有可能的值组合 expand
expand(数据框,第一列,第二列,第三列)

这个就牛逼了,真的是所有可能性都列出来了卧槽。

**四 一列拆多列(多列指两列及以上)
这个牛逼了,要是我的钱能一摞变多摞就好了。。

  • 按列分割 separate
separate(数据框, 拆分的列, 要建立的列名, sep = “传说中的分隔符”, remove = TRUE, 是否要删除被分割的那一列)
  • 按行分割 separate_rows
    和上一个差不多啦,不过就是按照某一行来分割

最后一个

  • 分割之后在合并(这玩意确定不是脱裤子放屁??后来证明,真不是)
    unite(数据框, 组合的新列名, 那些列要组合(和之前1:3差不多啦), sep = “传说中的分隔符,默认下划线”, remove = TRUE是否要删除被分割的那一列)
    这个玩意就贼牛逼了。不过我今天实在是太累了。。数据例子的图先不截图了。。后面补充~~

坑爹的开题报告幸亏这是老子最后一次写这个JB玩意了。等我毕业了,这玩意就下地狱去吧~拜拜了您内。。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 31,893评论 2 89
  • 一、C语言基础 1、struct 的内存对齐和填充问题其实只要记住一个概念和三个原则就可以了: 一个概念:自然对齐...
    XDgbh阅读 2,196评论 1 38
  • 《陪孩子走过小学六年》 开头: 1.自我介绍 2.彼此介绍, 我叫什么,我家宝宝几岁,今天为什么来这里? 3.和你...
    索班班阅读 182评论 0 0
  • 跃迁这本书从学习方法、选择战略、思维模式等多个维度,系统说明了高手与普通人的区别,介绍了个人实现爆发式成长的...
    一支独书阅读 835评论 0 1
  • 烈日炎炎照四野 田间芳草萎凄凄 乌云滚滚天边来 地上顿时流成河 彩虹暖暖天边挂 禾苗吱吱高里拔 花儿朵朵满枝桠 阳...
    倾心阅斋阅读 318评论 6 13