本体是给定域内的知识体系的正式表示。本体通常由一组具有在它们之间运行的关系的类(或术语或概念)组成。基因本体论(GO)从三个方面描述了我们对生物领域的了解:
本体 | 生物意义 |
---|---|
分子功能 | 由基因产物进行的分子水平活动。分子函数术语描述了在分子水平上发生的活性,例如“催化”或“转运”。GO分子函数术语表示活动而不是执行动作的实体(分子或复合体),并且不指定动作发生在何处,何时或在何种上下文中。分子功能通常对应于可以由单个基因产物(即蛋白质或RNA)进行的活性,但是一些活性通过由多种基因产物组成的分子复合物进行。广义功能术语的实例是催化活性和转运蛋白活性 ; 较窄的功能性术语的实例是腺苷酸环化酶活性或Toll样受体结合。为了避免基因产物名称与其分子功能之间的混淆,GO分子功能通常附加“活性”一词(蛋白激酶具有GO分子功能蛋白激酶活性)。 |
细胞组分 | 相对于基因产物发挥功能的细胞结构的位置,细胞区室(例如,线粒体)或它们所属的稳定的大分子复合物(例如,核糖体)。与GO的其他方面不同,细胞组分类不是指过程而是指细胞解剖学。 |
生物过程 | 通过多种分子活动实现的更大的过程或“生物程序”。广泛的生物学过程术语的实例是DNA修复或信号转导。更具体的术语的实例是嘧啶核碱基生物合成过程或葡萄糖跨膜转运。注意,生物过程不等同于途径。目前,GO并不试图表示完全描述路径所需的动力学或依赖性。 |
在GO注释的实例中,基因产物“细胞色素c”可以通过分子功能 氧化还原酶活性,生物过程 氧化磷酸化和细胞组分 线粒体基质来描述。
GO词汇表旨在与物种无关,包括适用于原核生物和真核生物的术语,以及单细胞和多细胞生物。
GO classes (也称为Terms)
GO类由定义,标签,唯一标识符和其他几个元素组成。这里描述了GO术语的元素。
GO图GO graph
了解并学会查看关系文件;层次结构类似进化树,有箭头的方向,即有父层次,也有子层次,唯一不同的是,子层次可有多个父层次。
GO的结构可以用图形来描述,其中每个GO Term是节点,并且Term之间的关系是节点之间的边。GO是松散的层次结构,“子”术语比“父”术语更专业,但与严格的层次结构不同,术语可能有多个父术语(请注意,父/子模型并不适用于所有类型关系,见关系文件)。例如,生物过程术语己糖生物合成过程中有两个亲本,己糖代谢过程和单糖生物合成过程。这反映了生物合成过程是代谢过程的一种亚型和a 的事实己糖是单糖的亚型。
一个本体......还是三个?
如上图所示,三个GO域(细胞成分,生物过程和分子功能)各自由单独的根本体术语表示。域中的所有术语都可以将其父项跟踪到根术语,尽管通过不同数量的中间项可能存在许多不同的路径到本体根。三个根节点是不相关的,并且没有共同的父节点,因此GO是三个本体。一些基于图形的软件可能需要单个根节点; 在这些情况下,可以添加“假”术语作为三个现有根节点的父节点。
三个GO本体是断续的,这意味着没有一个关系,从不同的本体术语之间运行。但是,GO本体之间的其他关系(如部分和规则)确实可以运行。例如,该分子功能术语“细胞周期蛋白依赖性蛋白激酶活性”是的一部分的生物过程“细胞周期”。有关关系的更多信息,请点击此处。
作为动态本体论
一直在更新。
GO旨在代表生物学中的当前知识状态,因此随着生物学知识的积累,它不断被修改和扩展。每周更改(最相对较小)。本体的修订由本体编辑团队管理,他们在生物学和计算知识表示方面具有丰富的经验。这些更新是由GOC本体团队和请求更新的科学家共同完成的。大多数请求来自科学家制作GO注释(这些通常只影响每个术语的几个术语),以及来自特定生物学领域的领域专家(这些通常会修改包含许多术语和关系的本体的整个“分支”)。我们邀请研究人员和计算科学家来提交对新术语,新关系或本体论的任何其他改进的请求。
有关本体的详细信息
- GO术语元素:GO术语格式的描述。
- 本体关系:关于GO中使用的期间关系的文档。
参考资料
1:基因本体论(Gene Ontology)