我们最常用最熟悉的功能数据库之一:GO(gene onotology),基因本体论。其实是一套标准词汇术语,目的是从不同角度来描述某个基因的特点和功能,三大本体如生物学进程(BP)、分子功能(MF)和细胞组分(CC)。
看文献的时候,偶然看到了TO(trait onotology)和CO(crop onotology)这些概念,网上一查,原来好几年前就提出来了,专门针对植物的,基于表型性状的一种分类方法,也建立起了相应的数据库。
一、PO/TO
Plant and Trait Onotology(PO、TO)的官网Planteome:https://planteome.org/,看到这个词,不仅想又一个组学?
PO和TO的区别:
关于TO,又有解释:
一套标准词汇术语近似于GO:
实际上,这个 PO 分析可以作为比较基因组的分析范畴:
也有有向无环图:
整个项目源码:https://github.com/Planteome/plant-trait-ontology
资料参考:Plant and Trait Ontology Current Status
二、CO
而 CO(crop onotology)又是另外一个项目了。它是从作物Crop的角度出发创建的一套分类标准和描述语录。
同样也是模仿的GO规则:
比如说水稻:
官网:http://www.cropontology.org/
源码:https://github.com/bioversity/Crop-Ontology
文档参考:Crop Ontology: Vocabulary For Crop-related Concepts
后记
分类在生物学中可谓无处不在,如我们用 Taxonomy 来做物种分类,使用KEGG Pathway 来分类不同通路途径等等,几乎所有的分析都要基于分类。
GO是从基因的角度出发创建的一套标准语义,PO/TO是从植物性状的角度,CO则是以作物本身的角度,那么是否还会有其他的Onotology提出并创建?理论上说,只要能分类,都是可以的。完全可以做transcript onotology、protein onotology、metabolite onotology等等。如下图,都可以,关键是有没有必要,这样做的意义大不大。反正在它们还没被广泛接受和应用的时候,我是不会用的。
表型和性状本身是个非常宽泛的词,如果只将生物的因果划分为表型和基因型两类,那么除基因组外的其他组学都可视为表型。