mcmctree配置文件解读2023-08-26

参数以及操作解读主要来自A Step-by-Step Tutorial: Divergence Time Estimation with Approximate Likelihood Calculation Using MCMCTREE in PAML (9 June 2011)和PAML MANUAL Version 4.9j (February 2020)

          seed = -1
       seqfile = examples/DatingSoftBound/mtCDNApri123.txt
#序列输入文件
      treefile = examples/DatingSoftBound/mtCDNApri.trees
#带有化石标记的树
       outfile = out

         ndata = 3
#这个需要改
       seqtype = 0  * 0: nucleotides; 1:codons; 2:AAs
#这个需要改
       usedata = 3    * 0: no data; 1:seq like; 2:use in.BV; 3: out.BV
#第一次用3第二次用2
         clock = 3    * 1: global clock; 2: independent rates; 3: correlated rates
       RootAge = <1.0  * safe constraint on root age, used if no fossil for root.

         model = 7    * 0:JC69, 1:K80, 2:F81, 3:F84, 4:HKY85
#7居然才是GTR
         alpha = 0    * alpha for gamma rates at sites
         ncatG = 5    * No. categories in discrete gamma

     cleandata = 0    * remove sites with ambiguity data (1:yes, 0:no)?

       BDparas = 1 1 0    * birth, death, sampling
#跟时间尺度有关系
   kappa_gamma = 6 2      * gamma prior for kappa
   alpha_gamma = 1 1      * gamma prior for alpha

   rgene_gamma = 2 2   * gamma prior for overall rates for genes
#计算
  sigma2_gamma = 1 10    * gamma prior for sigma^2     (for clock=2 or 3)
#一般设置sigma2_gamma = 1 4.5 
      finetune = 1: 0.1  0.1  0.1  0.01 .5  * auto (0 or 1) : times, musigma2, rates, mixing, paras, FossilErr
#第一个数字为1就可以自动调整
         print = 1
        burnin = 2000
      sampfreq = 2
       nsample = 20000

*** Note: Make your window wider (100 columns) before running the program.

ndata是数据分区，几个分区就写几。
seqtype数据类型，自己选择。
usedata这个先用3选项生成in.BV，再用2使用in.BV
clock分子钟，这个我觉得是越复杂越好，1固定速率分子种;2独立的互不干扰速率分子钟;3自动关联速率分子钟（我从翻译上理解的意思），那肯定无脑3，默认也是3
RootAge这个相当于一个树根的最远距离年代。
model服！为啥它不把所有模型在mcmctree里面列出来，我找到了所有的，一共10个，一般我用第7个REV就是GTR模型。

image.png

image.png

图片截自 PAML MANUAL

虽然我每次都会选model,但是仔细看了mcmctree才发现，如果使用usedata = 2，model, alpha, ncatG都不用设置了。

image.png

cleandata=0意味着在似然性计算中将对齐间隙和模糊字符视为缺失数据，如果设置为1会删除数据中它认为低质量的序列。
BDparas若输入有根树文件中的时间单位发生改变，则需要相应修改出生率和死亡率的值。例如，时间单位由100Myr变换为1Myr，则要设置成".01 .01 0.1"。

BDparas 来源参考连接，根据手册原文，也是调整节点密度的参数，虽然看不懂怎么调节，咱就用默认的100Myr。

kappa_gamma，alpha_gamma这两个参数也是，如果咱们使用usedata = 2 or 3就可以不用设置，他会计算，非常省事。
rgene_gamma这个算是需要计算的，虽然我发现直接按照经验填写的差不多。

image.png

m和s来自baseml结果
我不懂数学，但是我看怎么算α也不可能不等于1吧？β才会算是有点变化。

baseml baseml.ctl

关于这个m和s的计算是使用baseml，计算方式就是先把树和矩阵先跑一个baseml，这个baseml非常简单，基本就是给它矩阵，树（需要在根部设置一个'@4.0'安全置根时间），模型就可以了。
跑完以后结果文件mlb中，Substitution rate is per time unit下面写的就是m&s的估值，取小数点两位就可以。
β=1/0.301806=3.31，那么rgene_gamma = 1 3.31

image.png

如果说rgene_gamma还能算出来点什么，但是对于sigma2_gamma，我表示绝望。
sigma2_gamma我没有看到直接计算出来结果的方式，只是说了一下这个分布大概是什么样。

然后就推荐了使用指定对数正态分布替代率方差的先验，我觉得这说的没头没脑，怎么就推荐了

image.png

但是采用固定的对数正态分布替代率方差的先验，找到一个文献依据。

Ma, Y., Zhang, L., Lin, Y., Yu, D., Storey, K. B. & Zhang, J. (2023) Phylogenetic relationships and divergence dating of Mantodea using mitochondrial phylogenomics. Systematic Entomology, syen.12596.

image.png

这篇写的我还看的懂，就是说Tong 2015篇文章比较后，觉得选择对数正态分布替代率方差的先验更保守更符合化石标记的不确定性。

Tong, K. J., Duchêne, S., Ho, S. Y. W. & Lo, N. (2015) Comment on “Phylogenomics resolves the timing and pattern of insect evolution.” Science 349, 487–487.

image.png

我觉得有这两篇参考文献，在昆虫范围内使用sigma2_gamma = 1 4.5应该可以的，有依据的。

最后一个参数finetune,这个第一个参数就可以设置自动调整。auto (0 or 1) : times, musigma2, rates, mixing, paras, FossilErr。所以其余值我就只用默认值。

image.png

burnin遗弃代数
sampfreq抽样频率
nsample最后结果代数
实际运行代数是抽样频率*最后结果代数，比如

image.png

最后执行

mcmctree mcmctree.ctl

mcmctree看似复杂，但是我一看beast我才吐血，那里面手动累死啊

参考
https://mp.weixin.qq.com/s/Av056mrqnLm8ok7z_Y4lTw
https://www.cnblogs.com/bio-mary/p/12818888.html

最后编辑于：2023.09.12 10:33:46

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,311评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,339评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,671评论 0赞 342
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,252评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,253评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,031评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,340评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,973评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,466评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,937评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,039评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,701评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,254评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,259评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,485评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,497评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,786评论 2赞 345

mcmctree配置文件解读2023-08-26

推荐阅读更多精彩内容