近期因为要分析CNV的数据,用TCGAbiolinks包进行数据下载,该包可能是TCGA分析最好的包,可以下载最新的数据。但在下载过程中迟迟下载不完,总是报错,很自然以为是网速的问题,然而,用了一次热点下载,下载结果仍然是下到3.2M的时候停止。
百度也无法解决此问题,最终想到可能是路径太长的问题,于是把目标路径设置为C:\Users\zyq\Documents\,同样的代码,基本下载成功了,共1147个文件,下载完1146个,还差一个,通过鼠标下载的方法把那个解压到对应的文件夹即可。
GDCdownload(query, method = "api")
这一步可以用鼠标下载,同时下载“gdc_manifest”
,“metadata.cart.2021-04-26”
,“gdc_download_20210426_082120.071064.tar”
这三个文件。将下载的“gdc_download_20210426_082120.071064.tar”
解压缩,里面有1147个文件夹,每个对应一个样本,拷贝到"C:\Users\zyq\Documents\LUAD\GDCdata\TCGA-LUAD\harmonized\Copy_Number_Variation\Masked_Copy_Number_Segment"
文件夹下,就可以运行GDCprepare()
函数了。
CNV_download <- GDCprepare(query = query,
save = TRUE,
save.filename = "TCGA-LUAD.CNV_download.rda")
后面就可以正常运行了。