不管实验室产不产生数据,我们总有机会下载已发表的数据来分析,记录一下不同数据库下载数据的方式。
随便看一套数据吧
(1)NCBI-GEO DataSets:
选择想要的数据进入SRA Run Selector 勾选需要的SRA数据(SRRXXX)--- Selected ---Accession List --- 生成txt文件
对于这样一个txt文件怎么下载里面的数据呢?
nohup prefetch --option-file SRR_Acc_List.txt & #nohup 和&组合是为了在后台运行
这样数据下载到哪里呢?
可以自定义:1.which perfetch 2.cd perfetch所在目录 3. ./vdb-config -i (可更改路径)
(2)EBI :https://www.ebi.ac.uk/ena/browser/home
搜索需要的数据并进入下载页面(点击study)
下载Download report 中的TSV(里面包含fastq和sra两种数据类型的ftp等一些信息)
下载TSV后直接保留fastq_ftp 或者 sra_ftp 列 记:ftp.txt
下载数据:
for i in $(cat ftp.txt)
do
wget $i
done