下载安装SRA Toolkit
网址:https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit
#下载
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/version/package_for_your_server.tar.gz
#解压
tar -zvxf package_for_your_server.tar.gz
#更新环境变量
vi ~/.bashrc
export PATH='/path/to/sratoolkit/bin:$PATH'
alias prefetch='/path/to/sratoolkit/bin/prefetch' #不然会报错no such file or directory
source ~/.bashrc
查找数据集ID
一般在文章Methods或者Data Availability部分
建立Accession List
如果只需要一部分数据也可以自行勾选
分割Accession List
如果数据太多,可以分开成几个列表同时下载,加快速度
split -l 10 -d SraAccList.txt SraAccList_ #每10行切一刀,前缀SraAccList_,后缀2位数字
得到
SraAccList_00
SraAccList_01
...
SraAccList_21
下载数据
cd path/to/save/files
nohup prefetch --option-file SraAccList.txt --max-size 400G > sra.log 2>&1 &
#默认max-size是20G,如果够了就不用改