第一大步:下载SRA Toolkit
1、从NCBI官网下载SRA Toolkit
https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software
2、解压已下载的文件
3、将SRA Toolkit添加到环境变量
(关于什么是环境变量:https://mp.weixin.qq.com/s?__biz=MzI5MTcwNjA4NQ==&mid=2247483872&idx=1&sn=7fb7e57b3ff5c06ebaff344370c8b4c8&chksm=ec0dc46adb7a4d7cc125ab3cf8361bf3e3fcf858edca7d7987d52bce3e9e3aa0b7d8f8f2adfa&scene=21#wechat_redirect)
简单而言,添加入环境变量后,每次打开Terminal后我们都能直接调用这些函数(如fastq-dump),而不需要重新告诉系统如何找到该函数(即路径)
echo 'export PATH=/home/gyao/program/sratoolkit.2.9.0-centos_linux64.tar.gz/bin:$PATH' >> ~/.bashrc
注意:上行代码斜体删除线处为已解压的sratoolkit文件夹中bin文件夹所在的位置——因每个电脑中该文件的安装位置而异
>>代表将内容添加到文档,并且不删除原文档内容
.bashrc为一个系统的隐藏文件
(在文件夹中显示隐藏文件的快捷键:Control+L)
4、保存该文件设置
source~/.bashrc
5、使用fastq-dump即可将.sra文件转换为.fastq文件格式
第二步:下载Aspera
该步骤详见:https://www.jianshu.com/p/9142911b2e15
(但其中一些步骤需要自行替换文件所在地址,以及sh命令可能无法打开.sh后缀文件的问题)
1、面对一不小心就几十个G的数据,我们需要用到Aspera
- 一个高速下载的插件
下载网址:https://downloads.asperasoft.com/connect2/
2、解压缩
3、安装
安装sh文件步骤:https://www.jianshu.com/p/98b6d853823e
此处我用./文件名.sh的方法成功打开(sh命令无效)
4、将acsp函数添加给系统(即让系统可通过acsp四个英文字母找到该函数)
echo "alias acsp=/home/sxuan/.aspera/connect/bin/ascp" >> ~/.bashrc
同样,上行命令中斜体删除线部分因文件所在地址而异,该地址可在安装完.sh之后的命令行中找到
一般为/home/(自己的用户名)
5、保存设置
source~/.bashrc
6、检查是否成功
acsp --help