昨天介绍了TCGA2STAT这个R包,今天来继续根据博文 TCGA数据下载方法简介中的顺序来介绍R包TCGAbiolinks包,其下载数据类型类似于TCGA2STAT,但是又比它难懂。
R包的下载
## try http:// if https:// URLs are not supported
source("https://bioc.ism.ac.jp/biocLite.R")
biocLite("TCGAbiolinks")
涉及的包很多,可能很久才能下载完,下载建议使用R,不要用Rstudio,效果更好。
可下载的数据
这里请参考TCGA2STAT对数据的介绍。TCGAbiolinks包的最新文档http://www.bioconductor.org/packages/release/bioc/manuals/TCGAbiolinks/man/TCGAbiolinks.pdf ,对下载数据做了介绍,还有涉及到不同的平台,下载什么样的数据。
一个案例
query <- GDCquery(project = "TCGA-ACC",data.category = "Copy Number Variation",data.type = "Copy Number Segment")
GDCdownload(query)
query.met <- GDCquery(project = "TCGA-GBM",legacy = TRUE,data.category = "DNA methylation",platform = "Illumina Human Methylation 450")
GDCdownload(query)
具体的情况,请多做实验来验证。