本体论(ontology):给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延规则的定义。可以把它当作是领域(领域的范围可以是特定应用中,也可以是更广的范围。)内部不同主体(人、机器、软件系统等)之间进行交流(对话、互操作、共享等)的一种语义基础,即由Ontology提供一种共识。而且Ontology提供的这种共识更主要的是为机器服务,机器并不能像人类一样理解自然语言中表达的语义,目前的计算机也只能把文本看成字符串进行处理。因此,在计算机领域讨论Ontology,就要讨论如何表达共识,也就是概念的形式化问题。
常见ontology数据库:Gene Ontology ,Anatomical Entity OntologyDisease Ontology ,Sequence Ontology, System Biology Ontology
Gene Ontology 为了描述基因和基因产物,定义了三个大的类别,即分子功能(Molecular function)、所参与的生物过程(Biological Process)、所处的亚细胞的定位(Cellular Component)。
Gene Ontology (GO)中关系描述:1、 "B is a A"是指B is a subtype of A. 2、 "B is part of A" 。3、B regulates A ,又细分为两个subrelationship,一个是positive regulates,另一个是negative regulates。
GO的注释有三种:1、人工查阅文献,将实验研究出来的分子功能和生物过程录入该数据库。
2、 利用BLAST类似的方法把没有实验证据的基因通过序列相似性连接到与它相似的功能已知的基因,也需要人工查阅。
3、完全通过计算自动生成,证据相对较弱一些。
biological pathway定义:通过细胞内分子间一系列行为,产生某种产物或导致细胞发生某种改变。主要就有三大类通路,一个就是metabolic pathways,Gene regulation pathways,signal transduction pathways。
目前流行的pathway数据库有:KEGG, BioCarta, BioCyc,Panther,PID和Reactome。
KEGG也是结构化的格式(同GO),KEGG包含的interaction(关系)有:蛋白-蛋白关系、基因表达关系、酶-酶关系。