1. RAxML 简介
RAxML (Random Axelerated Maximum Likelikhood) 能使用多线程或并行化使用最大似然法构建进化树。
2. RAxML 下载与安装
wget https://github.com/stamatak/standard-RAxML/archive/v8.2.12.tar.gz
tar zxf RAxML-v8.2.12.tar.gz
cd RAxML-8.2.12/
make -f Makefile.SSE3.PTHREADS.gcc -j 4
rm *.o
make -f Makefile.AVX.PTHREADS.gcc -j 4
rm *.o
echo 'PATH=$PATH:/opt/biosoft/RAxML-8.2.12/' >> ~/.bashrc
source ~/.bashrc
3. RAxML 的使用
3.1 常用例子与参数
简单快速方式
raxmlHPC-PTHREADS-SSE3 -f a -m GTRGAMMA -p 12345 -x 12345 -# 10 -s 20k.phy -n chr001.raxml -T 30
RAxML 的参数非常多,设置非常复杂,上述常用例子的参数为:
-f a
此参数用于选择 RAxML 运算的算法。可以设定的值非常之多。 a 表示执行快速 Bootstrap 分析并搜索最佳得分的 ML 树。
-x 12345
指定一个 int 数作为随机种子,以启用快速 Bootstrap 算法。
-p 12345
指定一个随机数作为 parsimony inferences 的种子。
-# 10
指定 bootstrap 的次数。
-m GTRGAMMA
指定核苷酸或氨基酸替代模型。 "PROT" 表示氨基酸替代模型,“GTR”表示碱基替代模型; GAMMA 表示使用 GAMMA 模型; X 表示使用最大似然法估计碱基频率。
-s 20k.phy
指定输入文件。phy 格式的多序列比对结果。软件包中包含一个程序来将 fasta 格式转换为 phy 格式。也可以通过Tassel或者Mega转换格式:vcf-phylip
-n chr001.raxml
输出文件的后缀为 .chr001.raxml 。
-T 30
指定多线程运行的 CPUs 。
3.2 结果文件
RAxML_bootstrap.ex bootstrapped trees
RAxML_bestTree.ex 最佳得分 ML 树
RAxML_bipartitions.ex 有 bootstrap 分值支持的最佳得分树,分值在 node 上。
RAxML_bipartionsBranchLabels.ex 有 bootstrap 分值支持的最佳得分树, 分值在 branch 上。FigTree不能识别此文件。
参考资料:
http://www.chenlianfu.com/?p=2225
http://bioinformatics.oxfordjournals.org/content/30/9/1312.full
网页版工具:
http://epa.h-its.org/raxml/submit_single_gene