将蛋白序列注释到已分类的功能类别, 如GO/COG/KO。
一、模式生物
模式生物:人类、大肠杆菌、拟南芥等。已知蛋白功能, 且存在数据库中。利用在线工具进行注释。
1.蛋白质 GO 注释
网站地址: http://amigo.geneontology.org/amigo/landing
2.蛋白质COG/KOG 注释
网站地址: https://www.ncbi.nlm.nih.gov/research/cog-project/
3.蛋白质 KO 注释
网站地址:https://www.genome.jp/kaas-bin/kaas_main
在KEGG分析中,经常会遇到K00010和Ko00010类似的编号。
简单来说,大写K+5个数字指的是KEGG数据库中的某类蛋白质编号,一个基因对应一个编号。
小写的ko+5个数字指的是pathway的编号,代表某一条代谢通路的编号。
一条代谢通路里可以有多个基因共同参与调控,也就是有多个K注释;一个基因可以参与多条代谢通路,也就是一个基因有多个ko注释。
K注释和ko注释之间是多对多的关系。
二、非模式生物
非模式生物:大象、蝙蝠、熊猫等。基因的功能, 以及参与的功能模块未知。序列比对、注释转移。
参考文章:
http://www.bioon.com.cn/news/showarticle.asp?newid=67369#:~:text=%E5%B0%8F%E5%86%99%E7%9A%84ko%2B%E4%BA%94%E4%BD%8D,%E6%98%AF%E5%A4%9A%E5%AF%B9%E5%A4%9A%E7%9A%84%E5%85%B3%E7%B3%BB%E3%80%82