R语言初级作业10题

打开 Rstudio 告诉我它的工作目录
getwd()
新建6个向量,基于不同的原子类型。(重点是字符串,数值,逻辑值)
a <- c('apple','pear','hello')
b <- c(3,5,7,9)
c <- c(F,T)
告诉我在你打开的rstudio里面 getwd() 代码运行后返回的是什么?
getwd()
新建一些数据结构,比如矩阵,数组,数据框,列表等重点是数据框,矩阵)
mat <- matrix(1:20,4,5)
array1 <- array(1:24,c(2,3,4))

patientid <- c(1,2,3,4)
age <- c(23,44,56,78)
etilogy <- c('CAD','MI','HF','CAD')
sur <- c(T,F,T,F)
EF <- c(25,45,22,40)

HF <- data.frame(patientid,age,etilogy,sur,EF)

myhead <-'My <- list'
g <- c(23,4,5,6)
h <- matrix(1:10,2)
k <- c("allen",'pear','watermelon')
mylist <- list(myhead=myhead,age_sg=g,h,k)
在你新建的数据框进行切片操作,比如首先取第1,3行, 然后取第4,6列
HF[1:3,]
HF[,4:5]
使用data函数来加载R内置数据集 rivers 描述它。并且可以查看更多的R语言内置的数据集https://mp.weixin.qq.com/s/dZPbCXccTzuj0KkOL7R31g
data(rivers)
rivers
下载 https://www.ncbi.nlm.nih.gov/sra?term=SRP133642 里面的 RunInfo Table 文件读入到R里面,了解这个数据框,多少列,每一列都是什么属性的元素。(参考B站生信小技巧获取runinfo table) 这是一个单细胞转录组项目的数据,共768个细胞,如果你找不到RunInfo Table 文件,可以点击下载,然后读入你的R里面也可以。
SRP <- read.table("SRP133642.txt",header = T,sep='\t')
dim(SRP)
class(SRP$BioSample)
mode(SRP$BioSample)

ncol(SRP)
1:ncol(SRP)
class(SRP[,1])
mode(SRP[,2])
for (i in 1:ncol(SRP)) {
  x=class(SRP[,i])
  print(x)
}
下载https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE111229 里面的样本信息sample.csv读入到R里面,了解这个数据框,多少列,每一列都是什么属性的元素。参考 https://mp.weixin.qq.com/s/fbHMNXOdwiQX5BAlci8brA 获取样本信息sample.csv) 如果你实在是找不到样本信息文件sample.csv,也可以点击下载。
load("sample.Rdata")
for (i in 1:ncol(pdata)) {
  x=class(pdata[,i])
  print(x)
}
把前面两个步骤的两个表(RunInfo Table 文件,样本信息sample.csv)关联起来, 使用merge函数。
m1 <- merge(pdata,a,by.y = 'Sample_Name',by.x = 'geo_accession')
基于下午的统计可视化。对前面读取的 RunInfo Table(SRP) 文件在R里面探索其MBases列,包括 箱线图(boxplot)和五分位数(fivenum),还有频数图(hist),以及密度图(density) 。
SRP$MBases
boxplot(SRP$MBases,main='boxplot')
plot(fivenum(SRP$MBases),main='fivenum')
hist(SRP$MBases,main = 'hist')
plot(density(SRP$MBases),main='density')
把前面读取的样本信息表格的样本名字根据下划线分割看第3列元素的统计情况。第三列代表该样本所在的plate
load(file="sample.Rdata")

Title=pdata$title
Title=as.character(pdata$title)
class(Title)

strsplit(Title[1],'_')[[1]][3]
length(Title)
plate <- unlist(lapply(Title,function(x){
  x
  strsplit(x,'_')[[1]][3]
}))
plate
根据plate把关联到的 RunInfo Table 信息的MBases列分组检验是否有统计学显著的差异。
a <- read.table('SRP133642.txt',header = T,sep='\t')
save(a,file='RunInfo.Rdata')
m1 <- merge(pdata,a,by.y = 'Sample_Name',by.x = 'geo_accession')
t.test(m1$MBases~plate)
分组绘制箱线图(boxplot),频数图(hist),以及密度图(density)
boxplot(m1$MBases~plate,main='boxplot')
e <- m1[,c("title",'MBases')]
e$plate <- plate
hist(e$MBases,main='boxplot',freq = F, breaks = "sturges")
plot(density(e$MBases))
使用ggplot2把上面的图进行重新绘制。
library(ggplot2)
e$num <- 1:768
colnames(e)

ggplot(e,aes(x=plate,y=MBases)) + geom_boxplot()   
# 频数图
ggplot(e,aes(x=MBases)) + geom_histogram(fill="lightblue",colour="grey") + facet_grid(plate ~ .) # 频数图
ggplot(e,aes(x=MBases,fill=plate))+geom_histogram()
ggplot(e,aes(x=MBases,fill=plate))+geom_histogram()
# 密度图
ggplot(e,aes(y=MBases,x=num)) + geom_point() + stat_density2d(aes(alpha=..density..),geom = "raster",contour = F)+ facet_grid(plate ~ .)  
ggplot(e,aes(x=MBases,fill=plate))+geom_density()
使用ggpubr把上面的图进行重新绘制。
# install.packages("ggpubr")
library(ggpubr)

ggboxplot(e, x="plate", y="MBases", color = "plate", palette = "aaas",add = "jitter") + stat_compare_means(method = "t.test")
gghistogram(e, x="MBases", fill = "plate",palette = c("#f4424e", "#41a6f4"))
ggdensity(e, x="MBases", fill = "plate",  color = "plate", add = "mean",palette = c("#f4424e", "#41a6f4"))
随机取384个MBases信息,跟前面的两个plate的信息组合成新的数据框,第一列是分组,第二列是MBases,总共是384*3行数据。
sample(e$MBases,384)

nrow(e)

 data <-  e[sample(nrow(e),384),]
 data <- data[,c(3,2,4,1)]
str(data)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,761评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,953评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,998评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,248评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,130评论 4 356
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,145评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,550评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,236评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,510评论 1 291
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,601评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,376评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,247评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,613评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,911评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,191评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,532评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,739评论 2 335