写在前面
最近服务器的我最常用的那个节点又坏了,那个环境我搭建的很好,几乎所有数据和软件都在那上面。但是,无奈之下只能换到另一个节点,一切都要从头再来,就包括安装软件,事已至此,趁这个机会,把软件安装流程再总结一下。
做数据分析,首先总要有数据在手吧,所以如何下载数据很重要。所以我重新在新的节点工作的时候,首先是安装SRAtoolkit,毕竟NCBI存储了几乎所有的测序数据,话不多说,先下载吧。
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.6-1/sratoolkit.2.9.6-1-ubuntu64.tar.gz
图1是我们选择的版本,
下载成功后的文件如下,
解压缩,命令如下
$ tar zxvf sratoolkit.2.9.6-1-ubuntu64.tar.gz
为了方便使用,不再引用相对路径,将其加入到环境变量,以后可以直接调用
写入环境变量
$ echo 'export PATH=/~/bin/sratoolkit.2.9.6-1-ubuntu64/bin:$PATH' >>~/.bashrc$ source ~/.bashrc
之后可以下载数据了,sratoolkit自带的prefetch功能非常强大,关于为什么推荐这个软件,一个英文帖子写的很详细,可以看到它比wget的好处是哪些。
HowTo: Access SRA Data · ncbi/sra-tools Wiki · GitHub
$ prefetch SRR号码
但是这个命令对SRR文件的大小有限制,一般不超过20G,所以,为了增大,使用以下命令
prefetch --max-size SRR号
这个软件还有很多功能,有时间可以好好钻研一下。