最近需要下载一批GSA数据,数据存放在国家生物信息中心GSA数据库中,比如我需要下载的数据为CRA008542,我们一般要到GSA数据库内搜索才能直达下载链接(图1)。
点击3之后跳转到检索结果页面(图2),该页面中可以查看aspera的命令行。点击之后弹出一个对话框(图3),首先是命令行,其次是下载key file,这个文件后续下载过程中会用到。
得到这些结果之后需要还需要安装aspera软件,其具体安装流程如下
wget -c https://download.asperasoft.com/download/sw/connect/3.10.0/ibm-aspera-connect-3.10.0.180973-linux-g2.12-64.tar.gz
tar -zxvf ibm-aspera-connect-3.10.0.180973-linux-g2.12-64.tar.gz
bash ./ibm-aspera-connect-3.10.0.180973-linux-g2.12-64.sh
如此这般便将aspera安装到了linux服务器上,但其仍不能随处运行,需要配置环境变量,首先需要找到aspera的安装路径,一般是安装在~/.aspera
中,找到安装路径,配置环境变量。
到~/.bashrc
文件中添加环境变量~/.aspera/connect/bin/
即可,最后保存环境变量即可。
随后使用图3中的命令行进行下载
[path/to/ascp] -P33001 -i [path/to/key/file] -QT -l100m -k1 -d aspera01@download.cncb.ac.cn:gsa3/CRA001407 /your/local/path
# 其中[path/to/ascp]是ascp的路径,我们已经将其配置到了环境变量中,因此可以直接使用ascp即可
# 最重要的是[path/to/key/file],这个便是图3中的key file,将其上传至linux服务器中,并配置好路径就可以了,比如我这里的路径就是~/gsadown/aspera01.openssh
# 最后,/your/local/path是自己的本地存放位置,自己设定一个位置即可
# 因此最后的命令行如下所示
ascp -P33001 -i ~/gsadown/aspera01.openssh -QT -l100m -k1 -d aspera01@download.cncb.ac.cn:gsa3/CRA001407 ~/gsadown/
同时,ascp可nohup在后台下载。