inputFile="tcgaRBPexp.txt"
library(limma)
library(stringr)
#读取输入文件,并对输入文件整理,多个基因取平均为一个基因表达
rt=read.table(inputFile,sep="\t",header=T,check.names=F)
rt=as.matrix(rt)
rownames(rt)=rt[,1]
exp=rt[,2:ncol(rt)]
dimnames=list(rownames(exp),colnames(exp))
data=matrix(as.numeric(as.matrix(exp)),nrow=nrow(exp),dimnames=dimnames)
data=avereps(data)
data=data[rowMeans(data)>0,]
#根据样本ID的第14-15位,给样本分组(tumor和normal)
data<-t(data)
table(str_sub(rownames(data),14,15))
group_list <-ifelse(as.numeric(str_sub(rownames(data),14,15)) < 10,'tumor','normal')
table(group_list)
cc<-cbind(data,group_list)
write.csv(cc,file = "添加正常和肿瘤分组后.csv")
TCGA肿瘤数据预处理与分组
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 可以看到每列为一个样本,每行为一个基因的ensmble。 目前肠矩阵中前20个样本为正常样本,后20个样本为肿瘤组...
- 随机抽样 记录合并 记录合并函数:concat([dataFrame1,dataFrame2,…])参数说明dat...
- 使用http://www.oncolnc.org/1.打开网站,输入“favorite gene” 可见,高TP5...