TCGA数据,指癌症测序数据,TCGA的全称为The Cancer Genome Atlas,癌症基因组图谱(TCGA)是美国国家癌症研究所(NCI)和国家人类基因组研究所(NHGRI)已生成的33种癌症的基因组的关键变化全方位,多三维地图之间的合作的TCGA数据集,其包含基因组数据的两个以上的PB的,已取得公开可用,以及该基因组信息有助于癌症研究界,提高预防,诊断,和治疗癌症。
自从2016年6月份去西安第四军医大学上了肿瘤培训的暑期学校,对TCGA数据的研究变开始了。莫名的觉得在这个领域可以做很多工作,贡献很多的力量。哈哈,TCGA数据蕴藏很多宝。
下面开始对TCGA数据的下载做介绍。对基因表达数据,可用于下载的是level 3 的,在官网http://cancergenome.nih.gov/ 已经不提供直接下载方式,目前见的多的是用API或data-transfer-tool,可惜两个我都不会。我想我只会R语言,应该高手开发出了类似的包来供科研者使用吧,果不其然,发现了好几个可以下载TCG的A数据的包。这些包我都做过实验,有些下载效果很好,有些下载不稳定,其中缘故不清,也许我的网络环境不好也是有可能的,现把我了解的都分享出来,其中好坏效果,当由你来实验判断。
TCGA2STAT
官网:
https://cran.r-project.org/web/packages/TCGA2STAT/
下载方式:
install.packages("TCGA2STAT")
帮助文档:
https://cran.r-project.org/web/packages/TCGA2STAT/TCGA2STAT.pdf
TCGAbiolinks
官网:
https://bioc.ism.ac.jp/packages/3.2/bioc/html/TCGAbiolinks.html
下载方式:
## try http:// if https:// URLs are not supported
source("https://bioc.ism.ac.jp/biocLite.R")
biocLite("TCGAbiolinks")
帮助文档:
https://bioc.ism.ac.jp/packages/3.2/bioc/manuals/TCGAbiolinks/man/TCGAbiolinks.pdf
RTCGA
官网:
http://bioconductor.org/packages/release/bioc/html/RTCGA.html
下载方式:
## try http:// if https:// URLs are not supported
source("https://bioconductor.org/biocLite.R")
biocLite("RTCGA")
帮助文档:
http://bioconductor.org/packages/release/bioc/manuals/RTCGA/man/RTCGA.pdf
RTCGAToolbox
官网:
http://bioconductor.org/packages/release/bioc/html/RTCGAToolbox.html
帮助文档:
http://bioconductor.org/packages/release/bioc/manuals/RTCGAToolbox/man/RTCGAToolbox.pdf
下载方式:
## try http:// if https:// URLs are not supported
source("https://bioconductor.org/biocLite.R")
biocLite("RTCGAToolbox")
这里仅仅对这四种下载方式做简单的介绍,提供了已知的较为好的方式。下次将这对四种方法做详细全面的介绍,以保证对想下载的任何数据都能得心应手。做好科研,多看文章,多做实验啦!
本期完结!