# BiocManager::install("BioinformaticsFMRP/TCGAbiolinksGUI.data")
# BiocManager::install("BioinformaticsFMRP/TCGAbiolinks")
gdcdata=function(i){
library(TCGAbiolinks)
projects <- getGDCprojects()
library(dplyr)
projects <- projects %>%
as.data.frame() %>%
select(project_id,tumor) %>%
filter(grepl(pattern="TCGA",project_id))
## 0.运行信息
print(paste0("Downloading number ",i,",project name: ",projects$project_id[i]))
## 1.查询信息
query.exp = GDCquery(project = projects$project_id[i],
data.category = "Transcriptome Profiling",
data.type = "Gene Expression Quantification",
workflow.type = "STAR - Counts")
## 2.正式下载
GDCdownload(query.exp)
## 3.多个数据合并
pre.exp = GDCprepare(query = query.exp)
## 4.提取表达量数据
library(SummarizedExperiment)
countsdata = SummarizedExperiment::assay(pre.exp,1)
fpkmdata=SummarizedExperiment::assay(pre.exp,5)
tpmdata=SummarizedExperiment::assay(pre.exp,4)
gene_id=data.frame(id=rowData(pre.exp)@listData[["gene_id"]], gene_name= rowData(pre.exp)@listData[["gene_name"]],gene_type=rowData(pre.exp)@listData[["gene_type"]])
counts=cbind(gene_id,countsdata)
fpkm=cbind(gene_id,fpkmdata)
tpm=cbind(gene_id,tpmdata)
#临床信息
clinical <- GDCquery_clinic(project = projects$project_id[i], type = "clinical")
## 5.保存数据
filename1 = paste0("result/",projects$project_id[i],"-counts.txt")
filename2 = paste0("result/",projects$project_id[i],"-fpkm.txt")
filename3 = paste0("result/",projects$project_id[i],"-tpm.txt")
filename4 = paste0("result/",projects$project_id[i],"-clinical.txt")
write.table(counts,filename1,sep="\t",col.names=T,row.names=F,quote=F)
write.table(fpkm,filename2,sep="\t",col.names=T,row.names=F,quote=F)
write.table(tpm,filename3,sep="\t",col.names=T,row.names=F,quote=F)
write.table(clinical,filename4,sep="\t",col.names=T,row.names=F,quote=F)
}
dir.create("result")
for (i in 1:33) {
gdcdata(i)
}
2022新版TCGA批量下载表达矩阵及临床信息
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 主要想介绍的是下载下来数据的数据处理这一块,不是特别建议RTCGA的下载方法,列出了是因为怕没有源文件后续数据处理...
- xml文件 count文件 count样子 每个count文件行名一致 得到 无列名 寻找列名 清空购物车 下载...
- 0.背景 关于样本id和分组信息:TCGA的样本id里藏着分组信息[https://mp.weixin.qq.co...
- 时光小屋批量备份,请看图片。 “时光小屋是一个供家人上传和分享孩子照片的私密共享相册,主要以手机 APP 形式使用...
- TCGA数据库在2022年4月初进行更新之后,小编第一时间给大家展示了TCGA数据库的变化,用图文的方式详细介绍了...