生信技能树 R语言 初级作业题目(上)

之前都是没有系统地学习R语言,5月26日去西安听生信技能树 R语言培训课,Jimmy大神布置的作业题,像我这样纯正小白的初学者,完全负基础,学了又忘,忘了又学,继续搬砖,一点点去理解,巩固基础,整理详细一点的版本,花了不少时间,方便像我这样纯正小白理解:

  • “#run”之前的代码是自己想、参考《R语言实战》课本和参考生信技能给的作业参考代码,“#run”之后的代码是运行结果。

  • “#”后的内容在RStudio里被忽略,为注视内容

  • 1 . 打开 Rstudio 告诉我它的工作目录
    Rstudio安装后,它默认工作路径一般是Rstudio的安装主目录,如我使用Mac系统,它默认的工作目录是"/Users/chenjiangshu"。如果使用windows系统,它在工作目录默认在安装路径下。

    1. 新建6个向量,基于不同的原子类型。(重点是字符串,数值,逻辑值)
a1 <- c("good morning")#字符串向量
a1
a2 <- c(1,5,8,16,21,25)#数值型向量
a2
a3 <- c("a","b","c","d","e","f")#字符型向量
a3
a4 <- c("a","b","c",1,2,3)#数值和字符混合,但calss默认是字符型
a4
a5 <- c(T,F,T,T,F,F)#逻辑值向量
a5
a6 <- c(1+0i)#复数向量
a6
#run:
> a1 <- c("good morning")#字符串向量
> a1
[1] "good morning"
> a2 <- c(1,5,8,16,21,25)#数值型向量
> a2
[1]  1  5  8 16 21 25
> a3 <- c("a","b","c","d","e","f")#字符型向量
> a3
[1] "a" "b" "c" "d" "e" "f"
> a4 <- c("a","b","c",1,2,3)#数值和字符混合,但calss默认是字符型
> a4
[1] "a" "b" "c" "1" "2" "3"
> a5 <- c(T,F,T,T,F,F)#逻辑值向量
> a5
[1]  TRUE FALSE  TRUE  TRUE FALSE FALSE
> a6 <- c(1+0i)#复数向量
> a6
[1] 1+0i
    1. 告诉我在你打开的rstudio里面 getwd() 代码运行后返回的是什么?
      打开RStudio在里面输入 getwd() 代码运行后返回的是操作的当前的工作目录,运行getwd() 代码相当于查看当前工作目录。


      R 第3题.png
    1. 新建一些数据结构,比如矩阵,数组,数据框,列表等重点是数据框,矩阵)
  • 4.1 用matrix()函数创建一个5行4列的矩阵

y <- matrix(1:20,nrow=5,ncol=4)
y
#run
> y <- matrix(1:20,nrow=5,ncol=4)
> y
     [,1] [,2] [,3] [,4]
[1,]    1    6   11   16
[2,]    2    7   12   17
[3,]    3    8   13   18
[4,]    4    9   14   19
[5,]    5   10   15   20
  • 4.2 用array()函数创建一个数组
dim1 <- c("A1","A2")
dim2 <- c("B1","B2","B3")
dim3 <- c("C1","C2","C3","C4")
z <- array(1:24,c(2,3,4),dimnames = list(dim1,dim2,dim3))
z
#run
> dim1 <- c("A1","A2")
> dim2 <- c("B1","B2","B3")
> dim3 <- c("C1","C2","C3","C4")
> z <- array(1:24,c(2,3,4),dimnames = list(dim1,dim2,dim3))
> z
, , C1

   B1 B2 B3
A1  1  3  5
A2  2  4  6

, , C2

   B1 B2 B3
A1  7  9 11
A2  8 10 12

, , C3

   B1 B2 B3
A1 13 15 17
A2 14 16 18

, , C4

   B1 B2 B3
A1 19 21 23
A2 20 22 24

数组是矩阵的一个自然推广。

  • 4.3 用data.frame()函数创建一个数据框
patientID <- c(1,2,3,4)
age <- c(25,34,28,52)
diabetes <- c("Type1","Type1","Type2","Type1")
status <- c("Poor","Improved","Excellent","Poor")
patientdata <- data.frame(patientID,age,diabetes,status)
patientdata
#run
> patientID <- c(1,2,3,4)
> age <- c(25,34,28,52)
> diabetes <- c("Type1","Type1","Type2","Type1")
> status <- c("Poor","Improved","Excellent","Poor")
> patientdata <- data.frame(patientID,age,diabetes,status)
> patientdata
  patientID age diabetes    status
1         1  25    Type1      Poor
2         2  34    Type1  Improved
3         3  28    Type2 Excellent
4         4  52    Type1      Poor

数据框不同的列可包含数值型,字符型的数据

  • 4.4 用list()函数创建一个列表
g <- "My First List"
h <- c(25,26,18,39)
j <- matrix(1:10,nrow = 5)
k <- c("one","two","three")
mylist <- list(title=g,ages=h,j,k)
mylist
#run
> g <- "My First List"
> h <- c(25,26,18,39)
> j <- matrix(1:10,nrow = 5)
> k <- c("one","two","three")
> mylist <- list(title=g,ages=h,j,k)
> mylist
$title
[1] "My First List"

$ages
[1] 25 26 18 39

[[3]]
     [,1] [,2]
[1,]    1    6
[2,]    2    7
[3,]    3    8
[4,]    4    9
[5,]    5   10

[[4]]
[1] "one"   "two"   "three"

列表可包含几个向量,矩阵,数据框,甚至组合的列表。

    1. 在你新建的数据框进行切片操作,比如首先取第1,3行, 然后取第4,6列
      首先构建的数据框至少有6列,3行,创建一个4行,6列的数据框:
patientID <- c(1,2,3,4)
age <- c(25,34,28,52)
diabetes <- c("Type1","Type1","Type2","Type1")
status <- c("Poor","Improved","Excellent","Poor")
gender <- c("male","female","female","male")
incomes <- c("8k","12k","4.5k","7k")
patientdata <- data.frame(patientID,age,diabetes,status,gender,income)
patientdata
patientdata[c(1,3),]
patientdata[,c(4,6)]
patientdata[c(1,3),c(4,6)]
#run
> patientID <- c(1,2,3,4)
> age <- c(25,34,28,52)
> diabetes <- c("Type1","Type1","Type2","Type1")
> status <- c("Poor","Improved","Excellent","Poor")
> gender <- c("male","female","female","male")
> income <- c("8k","12k","4.5k","7k")
> patientdata <- data.frame(patientID,age,diabetes,status,gender,income)
> patientdata
  patientID age diabetes    status gender income
1         1  25    Type1      Poor   male     8k
2         2  34    Type1  Improved female    12k
3         3  28    Type2 Excellent female   4.5k
4         4  52    Type1      Poor   male     7k
> patientdata[c(1,3),]
  patientID age diabetes    status gender income
1         1  25    Type1      Poor   male     8k
3         3  28    Type2 Excellent female   4.5k
> patientdata[,c(4,6)]
     status income
1      Poor     8k
2  Improved    12k
3 Excellent   4.5k
4      Poor     7k
> patientdata[c(1,3),c(4,6)]
     status income
1      Poor     8k
3 Excellent   4.5k
data()
rivers#北美主要河流及长度,
head(rivers)
tail(rivers)
length(rivers)#rivers有多少对象元素
str(rivers)#查看河流的结构
summary(rivers)#获取描述性统计量(最小值/最大值/四分位数/数值型变量/因子向量/逻辑值向量
#run
> head(rivers)
[1] 735 320 325 392 524 450
> tail(rivers)
[1]  500  720  270  430  671 1770
> length(rivers)#rivers有多少对象元素
[1] 141
> str(rivers)#查看河流的结构
 num [1:141] 735 320 325 392 524 ...
> summary(rivers)#获取描述性统计量(最小值/最大值/四分位数/数值型变量/因子向量/逻辑值向量)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  135.0   310.0   425.0   591.2   680.0  3710.0 

"head"和"tail"一般默认读前6行和后6行。

    1. 下载 https://www.ncbi.nlm.nih.gov/sra?term=SRP133642 里面的 RunInfo Table 文件读入到R里面,了解这个数据框,多少列,每一列都是什么属性的元素。(参考B站生信小技巧获取runinfo table) 这是一个单细胞转录组项目的数据,共768个细胞,如果你找不到RunInfo Table 文件,可以点击下载,然后读入你的R里面也可以。
SraRunTable <- read.table("http://www.bio-info-trainee.com/tmp/5years/SraRunTable.txt",fill=TRUE,header = T,sep = "\t")
dim(SraRunTable)
class(colnames(SraRunTable))
#run
> SraRunTable <- read.table("http://www.bio-info-trainee.com/tmp/5years/SraRunTable.txt",fill=TRUE,header = T,sep = "\t")
> dim(SraRunTable)
[1] 768  31
> class(colnames(SraRunTable))
[1] "character"

768行,31列,元素为字符型。

sample <-read.csv("sample.csv")
colnames(sample)
#run
> sample <-read.csv("sample.csv")
> colnames(sample)
 [1] "Accession"           "Title"               "Sample.Type"         "Taxonomy"           
 [5] "Channels"            "Platform"            "Series"              "Supplementary.Types"
 [9] "Supplementary.Links" "SRA.Accession"       "Contact"             "Release.Date" 
    1. 把前面两个步骤的两个表(RunInfo Table 文件,样本信息sample.csv)关联起来,使用merge函数。
SraRunTable <- read.table("http://www.bio-info-trainee.com/tmp/5years/SraRunTable.txt",fill=TRUE,header = T,sep = "\t")
sample <-read.csv("sample.csv")
m=merge(SraRunTable,sample,by.x = 'Sample_Name',by.y = 'Accession')
str(m)
#run
> str(m)
'data.frame':   768 obs. of  42 variables

合并后有768个对象,42个变量

课程分享

生信技能树全球公益巡讲

https://mp.weixin.qq.com/s/E9ykuIbc-2Ja9HOY0bn_6g

B站公益74小时生信工程师教学视频合辑

https://mp.weixin.qq.com/s/IyFK7l_WBAiUgqQi8O7Hxw

招学徒:

https://mp.weixin.qq.com/s/KgbilzXnFjbKKunuw7NVfw

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容