整个流程是使用氨基酸序列进行分歧时间推断。
输入文件准备
- 符合paml格式要求的phy
111 3789
Acosmetura_nigrogeniculata_NC_045212 -MMTNLFSVFDPSTNIM-NLSLNWLSTIIGMMILPL
Alloxiphidiopsis_emarginata_NC_065298 -MMTNLFSVFDPSTNIM-NLSLNWLSTFLGMMVLPL
Anabropsis_guangxiensis_NC_068726 --MTNLFSVFDPSTSIM-NTSLNWTSTFIGLLMIPS
...
如果格式不符合要求可以使用trimal自带工具制作符合要求的文件。
readal -in $in -out $out.phy -phylip_paml
- 带有化石标记的有根树
111 1
(OG_Schizodactylus_jimo_NC_068225,((...)'>0.592<0.616')))'@2.901';
我们可以使用
gotree
快速获得去除支持度和枝长的结构树:
cat $input_tree | gotree brlen clear |gotree support clear >out.tree
树文件的第一行是物种数量
空格树的数量
mcmctree的单位是亿年(100个Mya),所以一般我们要把获得时间单位除以100. 化石标记的结构:>最年轻时间<最古老时间
,@大约时间
配置mcmctree.ctl文件
整个文件除了上述的两个输入文件外,真正需要计算的只有rgene_gamma、sigma2_gamma。根据之前写的计算rgene_gamma我们可以自行计算。sigma2_gamma则是根据文献选择昆虫纲的经验值sigma2_gamma = 1 4.5
,参见之前的内容。配置齐活,就可以开始mcmctree mcmctree.ctl
两次,进行分歧时间计算了,计算结束后如果两个run结果接近就可以使用了。
最好也输入RootAge =
。
for me
- 准备两个输入文件;检查树文件的第一行为
物种数量 树的数量
。 - 同一个文件夹下,执行
Step1_rgene_gamma_AA.sh
- 将rgene_gamma输入到mcmctree.ctl,同时修改
RootAge =
- 运行
Step2-3_mcmctree_AA.sh
- 两个run运行结束,执行收敛检查
Step4_Convergence_verification.sh