注释数据库KEGG和GO
KEGG
构成
- KEGG是一个综合数据库,里面包含了很多种类的信息。KEGG数据库包括PATHWAY、KO等多个子库。
PATHWAY
- KEGG pathway的检索结果是一张描述不同基因在某一过程中相互作用的图
- 每个KEGG pathway都有一个标识符,这个标识符由一个字母前缀和一个五位的数字组成
PATHWAY前缀
对于KEGG pathway来说,前缀可以有以下五种
* map:基因互作的通路图
* ko:在map的基础上高亮显示基因(点击可以展示具体信息)
* ec:在map的基础上高亮显示参与反应的酶(点击可以展示具体信息)
* rn:在map的基础上高亮显示发生的生化反应(点击可以展示具体信息)
* <org>:查找特定物种的通路图(每个物种有一个专用的编号,比如人是hsa,如果不知道号码是什么,可以点击Organism
按钮,输入拉丁名就可以显示编号,并将其加入搜索框)
KO
- KO数据库是用来搜索基因的。同样,每个基因也有一个标识符。在KO数据库中,这个标识符以K开头,后加一个五位数字。
- KO的搜索结果包含与基因有关的一系列信息,包括名称、参与的通路、相关的疾病等
- 注意KO数据库里搜出来的是基因,PATHWAY的ko前缀里面找出来的是通路,但KO数据库里找出来的基因的信息里展示了对应的ko通路
GO
GO term
- GO数据库从三个不同的角度对同一基因进行描述。这些描述词汇称作GO term
- 细胞学组分(cellular components,CC)
- 分子功能(molecular functions,MF)
- 生物学过程(biological process,BP)
细胞组分
- 细胞中的位置
- 指基因产物位于何种细胞器或基因产物组中
分子功能
- 描述在分子生物学上的活性,如催化活性或结合活性
- 只定义功能,也不指出这些功能具体的时空信息
生物学过程
- 由分子功能有序地组成的,具有多个步骤的一个过程
- 与一个生物学通路不完全相等
GO注释
- 用一系列GO term对某一基因进行描述
- 一个基因可能不止一个GO term
GO检索
- 在GO中进行检索,可以得到三种结果
- Ontology:这里显示了与检索词匹配的GO term
- Genes and gene products:这里显示了与检索词匹配的基因及产物
- 点击基因名可以查看描述这个基因的GO term
- Annotations:这里显示的是GO term与基因及产物之间的对应关系
- 因为一个GO term可对应多个基因,一个基因也可对应多个GO term,因此这里的条目非常多
GO富集
- GO数据库首页提供了在线进行富集分析的功能