学习小组Day6笔记-梦幻天堂

今天任务安装R包并处理一个数据文件

R包

R包都有自己的说明书（cheatsheet），俗称小抄。

以后学习R包，主要自己研究小抄，那么小抄的获得方式有哪些？

方法1：去百度/谷歌XX小抄
方法2：找Rstudio的cheatsheet网站（网速好慢的）
https://www.rstudio.com/resources/cheatsheets/
方法3. 教程里用到的包都可以到生信星球公众号回复相应的包名来获取

了解tidyr包

tidyr的功能主要有：
（1）数据框的变形
（2）处理数据框中的空值
（3）根据一个表格衍生出其他表格
（4）实现行或列的分割和合并

这个包是把你要用的数据处理成标准而统一的数据框,就是数据分析前的准备工作。

安装tidyr包

下载和安装tidyr包

install.packages("tidyr")

加载tidyr包

library(tidyr)

新建数据框

a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))

自己随便建立一个数据框如下

bioplanet<-data.frame(ID=c(1:5),genesmyble=c("w","f","d","e","p"),expression=c(6:10))

Snipaste_2018-10-27_19-59-39.png

注释与注意事项

rep，重复，括号中填要重复的字符和重复次数。
paste，连接两个字符串，括号要填两个代连接字符并指定分隔符（sep），没有分隔符就填sep=“”。
1：3表示从1到三。如需一列中需要填入三个无规律的数字，可以用向量c(1，3，4)，同样如果填的是字符串也需要加双引号，例如c("doudou","huahua","xiaoyu")。
2.了解概念：key-value--“键值对” ，表示一种对应关系。“键”和“值”都是列名，如SampleName和Expression的对应。
3.函数后面一般都要加括号，括号里第一个参数是都数据框名
4.字符串要加双引号（行名和列名也是字符串，但是可以不用加），其他单元格（姑且这么叫了）里出现的字符串要加。
行 raw
列 column，简化写法为col

了解Tidyr Data

这是一种组织表格数据的方式，提供了一种能够跨包使用的“统一”的数据格式。
什么叫“统一”？
每个变量（variable）占一列，每个情况（case，姑且这么翻译）和观测值（observation）占一行。

整理数据（Reshape Data）

先了解两个函数

gather函数：将宽数据变成长数据格式。把列名变行数值。
spread函数：将长数据变成宽数据格式。把列数值变列名。

新建一个数据文件

> a<- data.frame(country=c("A","B","C"),"1999"=paste("K",c(0.7,37,212)),"2000"=paste("K",c(2,80,213)))
> View(a)

Snipaste_2018-10-27_20-58-40.png

将列名合并成一个列

gather(a,X1999,X2000,key = "year",value = "cases")

Snipaste_2018-10-27_21-09-13.png

gather括号里的分别是：
数据框名，需合并的列名（两个），合并后的key列名，value列名。
其中，需合并的列名也可以列在最后(其实个顺序才是默认的)，key=和value=也可以省略，如果按照上面小抄的命令括号里那个顺序，省略了就会报错。
简化代码gather(a,"year","cases",X1999,X2000) #推荐的偷懒做法
合并前的列名如果比较多，可以用排除法来偷懒，在上图例子中可用gather(a,year,cases,-country) #-country的意思就是合并除country外剩下的列。

处理丢失的数据

三种处理方式：
(1).删除整行
(2).根据上下文（瞎）蒙一个
(3).同一列的空值填上同一个数。

删除整行
drop_na()：有空值的，整行删除掉
括号里填数据框名，依据的列名（有空值那一列的列名）

Snipaste_2018-10-27_21-19-05.png

这里注意读入数据并赋值给一个变量

Snipaste_2018-10-27_21-21-04.png

在这里之所以选择了csv，是因为这个神奇的格式支持R和Excel，默认参数好的很（默认分隔符是“，”，导出时也不会默认加引号。如果你用read.table试试就知道默认参数多笨了），并且转换txt也不会变乱码！
在这里补充下csv的导入和导出方式。(默认参数好，学R没烦恼)
导入：X<-read.csv('doudou.csv')
导出：write.csv(X,'doudou.csv')

根据上下文（瞎）蒙一个
fill()，根据上一行的数值填充上（好应付的感觉）

Snipaste_2018-10-27_22-09-00.png

原文件

Snipaste_2018-10-27_22-11-13.png

分割后的文件

Snipaste_2018-10-27_22-09-06.png

csv 文件是用逗号分隔的，故而 sep = ","
tsv 文件是用制表符分隔的，故而 sep = "\t"
常用的分隔符还有空格 sep = " "
分隔符是任意的，可根据具体情况指定的。
在输入的时候，原内容是用什么符号分隔的，sep就要保持一致，否则可能无法正确读取

因为少打了sep函数0.7变成0了，经花花指导，原来不加sep自动识别分隔符，把小数点也算成分隔符了。因为只指定分割两列，所以7不出来了。
改为separate(a,X1999,into = c("cas","rep"),sep=" ")成功分割。

Snipaste_2018-10-27_22-34-23.png

思维导图

R处理数据文件.png

今天学习结束，好像比昨天简单了一些，也许是我进步了。^_

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,602评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,442评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,878评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,306评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,330评论 5赞 373
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,071评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,382评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,006评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,512评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,965评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,094评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,732评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,283评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,286评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,512评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,536评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,828评论 2赞 345

学习小组Day6笔记-梦幻天堂

今天任务安装R包并处理一个数据文件

R包

了解tidyr包

安装tidyr包

下载和安装tidyr包

加载tidyr包

新建数据框

了解Tidyr Data

整理数据（Reshape Data）

新建一个数据文件

将列名合并成一个列

处理丢失的数据

推荐阅读更多精彩内容