经历过OrthoMCL软件包安装的艰辛(然而,终究也没安装成功),就知道转而用BPGA包是有多么香了。话不多说,来看看BPGA是如何安装且使用的吧
一、BPGA下载和安装
首先是GPGA的官方网站:https://iicb.res.in/bpga/index.html
- 接下里就是点击左边的
Downloads
;
按照下图所示进行点击进入软件包所在位置
我选择的是Linux版本的软件包
#下载
wget https://master.dl.sourceforge.net/project/bpgatool/BPGA-1.3-linux-x86_64-0-0-0.tar.gz?viasf=1 -O BPGA_V1.3_linux.tar.gz
#解压缩
tar zxvf BPGA_V1.3_linux.tar.gz
#更改权限,进入该软件的bin/目录下
chmod +x BPGA-Version-1.3
- 软件的配置--usearch
该软件的运行还需要下载usearch软件,后期聚类过程会用到
usearch网址:https://www.drive5.com/usearch/download.html,但是该软件32位的是免费的,64位的是收费的,那只能选择32的进行下载了
#usearch下载
wget https://www.drive5.com/downloads/usearch11.0.667_i86linux32.gz -O usearch_linux32.gz
#解压缩
gunzip usearch_linux32.gz
#赋予可执行权限
chmod +x usearch
#将其添加到环境变量中
echo 'export PATH=/home/ahykdx/bio_tools:$PATH' >>~/.bashrc
source ~/.bashrc
前面说到BPGA软件的运行需要usearch软件的加持,且软件使用说明书里面明确需要将usearch软件copy到BPGA的bin目录下,因此:
cp /home/.../usearch /home.../BPGA-Version-1.3/bin
二、BPGA软件的使用
那么安装好了,肯定是要用起来的咯,首先从准备文件开始
首先是官网中给出了输入文件的类型,你们看看
反正准备好上述四种格式文件就可以,我根据自己的数据情况,选择的是第四种格式。其实也就是一般的fasta文件格式就行。
如果有好几个细菌的基因组,那就需要把对应的每个个体的蛋白序列复制到一个文件夹下,然后以xx.fasta
fasta文件格式结尾,要全部统一成这种文件命名格式,否则后期运行会报错
全部准备好的话,就可以开始运BPGA软件了
#首先要告知的是该软件是从终端不断按照指令输入,类似于交互式执行的方式,首先输入以下命令
BPGA-Version-1.3 # 前面忘记写了,就是得把BPGA 软件的bin目录放到环境变量中去。
然后根据以下提示:
我选择的是
3
,一键完成1和2的内容,是我喜欢的风格-
接下来就是问你输入文件的格式
我选择的是第四种文件格式。
-
接下来就是输入文件所在的目录就可以了
# 比如我准备的几种细菌的基因组蛋白序列是在/home.../bacteria/protein_fasta目录下,那我就在Enter:后面将我的目录paste后点击Enter键就可以不管,让软件自己一键运行就能完成。
Enter: /home.../bacteria/protein_fasta
写在最后
其实到这里,基本上BPGA软件的介绍就结束了,感兴趣的可以试一下,反正是暂时解决了我装不上OrthoMCL软件的烦恼。