montreal 生信人 2018-02-07
大家好!又见面了。本期承接上期进化树作图专题1的内容,和大家分享一下关于进化树图的几种分类。
依据不同规则,树的分类可以有很多种。由于本专题主要针对于作图,所以这里主要的原则就是——树的外形。所谓“根”,就是一棵树上的所有基因或物种的最近共同祖先(most recent common ancestor,MRCA)。按照这个祖先的位置是否知晓,进化树可以划分为有根树(rooted tree)和无根树(unrooted tree):顾名思义,一个有根,而另一个没有根。本文的内容都是针对有根树,对于无根树将在以后加以介绍。让我们来看以下三个基本概念:cladogram, phylodram,和dendrogram。
我们为它们分别准备了一个实例:
Cladogram
From [1]
Phylogram
From [2]
Dendrogram
From [3]
三者的区别其实很简单,关键在于枝长(branch length)是否代表进化距离。实际上,三者的分别可以由对英文单词的剖析中窥见一斑,其历史都是源远流长,可以追溯到苏格拉底和亚里士多德的时代(括号内为希腊文写法):
Phylo:race or tribe (fyli, φυλή)
Clado:branch (clados)
Dendro:tree (dendro)
Gram:written or drawn (gramma, γράμμα).
所以看图,再结合词根的意思,我们不难发现:
1. cladogram强调branching的关系,或者可以理解为拓扑上的关系,枝长(branch length)不代表进化距离,每一个tip在末段对齐。
2. phylogram强调的是phylogenetics,枝长有意义,通常代表变化的多少或进化的距离,越长距祖先状态变化越大
3. dendrogram是一种特殊的phylogram,其末端的tip对齐,常用于表示物种分化时间(divergence time)。换言之,从一个祖先衍生出的不同物种或许有着不同的进化历程,却经历了相同的进化时间。(如下图所示)
其实还有一种phylogram,为了作图时的美观和清晰,把基因名或者物种名在末端用虚线对齐,但这无法改变其phylogram的本质,如下所示:
From [4]
其实到这里,因为市面上常见的图的几种类型就基本介绍完了。不过如果你对进化树的造型感兴趣,不妨继续往下看一颗有根树的造型还可以怎样千奇百怪。
这里,小编采用上期介绍的Archaeopteryx软件,选取Pfam ID:01855作图举例。
Rectangular:
Euro:
Rounded:
Curved:
Triangular:
Convex:
Circular:
后面的几种图是不是很少见?确实,它们在publication里的应用可能少一些。不过,如果运用得当,绝对可以是可以成为加分项的。请看下面几幅图:
From [5]
From [6]
Adapted from [7]
如果你要说,怎么有几种图从来都没见过。其中一个原因是普通的rectangular tree可以满足作图的基本要求,另外的原因就是作者们可能对其他类型的进化树作图缺乏了解,以及相应的软件太过低调。想了解这些图是怎样做出来的吗?请锁定生信人公众号。
参考资料
1. Zeng L, Zhang Q, Sun R, Kong H, Zhang N, Ma H. 2014. Resolution of deep angiosperm phylogeny using conserved nuclear genes and estimates of early divergence times. Nat Commum.5:4956.
2. Roychowdhury T, Vishnoi A, Bhattacharya A. Next-Generation Anchor Based Phylogeny (NexABP): Constructing phylogeny from Next-generation sequencing data. Sci Rep. 2013;3.
3. Phylogenetic Resolution in Juglans Based on Complete Chloroplast Genomes and Nuclear DNA Sequences. Dong W,, Xu C,, Li W, Xie X, Lu Y, Liu Y,, Jin X, Suo Z. Front Plant Sci. 2017 Jun 30; 8:1148. [PMID:28713409]
4. Evolution of substrate specificity in a retained enzyme driven by gene loss. Juárez-Vázquez AL, Edirisinghe JN,, Verduzco-Castro EA, Michalska K,, Wu C, Noda-García L, Babnigg G, Endres M, Medina-Ruíz S, Santoyo-Flores J, Carrillo-Tripp M, Ton-That H, Joachimiak A,,, Henry CS,, Barona-Gómez F. Elife. 2017 Mar 31; 6. [PMID:28362260]
5. Cladistic analysis of olfactory and vomeronasal systems. Ubeda-Bañon I, Pro-Sistiaga P, Mohedano-Moriano A, Saiz-Sanchez D, de la Rosa-Prieto C, Gutierrez-Castellanos N, Lanuza E, Martinez-Garcia F, Martinez-Marcos. Front Neuroanat. 2011 Jan 26; 5:3. [PMID:21290004]
6. Sample sequencing of vascular plants demonstrates widespread conservation and divergence of microRNAs. Chávez Montes RA, de Fátima Rosas-Cárdenas F, De Paoli E, Accerbi M, Rymarquis LA, Mahalingam G, Marsch-Martínez N, Meyers BC, Green PJ, de Folter S. Nat Commun. 2014 Apr 23; 5:3722. [PMID:24759728]
7. Efficient Gene Tree Correction Guided by Genome Evolution. Noutahi E, Semeria M, Lafond M, Seguin J, Boussau B, Guéguen L, El-Mabrouk N, Tannier E,. PLoS One. 2016 Aug 11; 11(8):e0159559. [PMID:27513924]
本文为作者原创原载于生信人微信公众号