对于大多数的数据库而言,API接口可以方便的从数据库中检索数据。kegg 数据库的API 链接如下:
API 其实就是一种约定号的URL 规则,通过特定的URL 返回不同的数据。kegg 的 API 的URL 构成如下:
http://rest.kegg.jp/operation/argument[/argument2[/argument3 …]]
前缀都是 http://rest.kegg.jp, 接下来就是对应的操作,kegg 一共提供了以下7种操作:
info
list
find
get
conv
link
ddi
接下来详细看下每种操作的用法
info
主要用于展示每个数据库共有多少条记录的统计信息和于该数据相关的其他数据库,url 格式如下:
http://rest.kegg.jp/info/database
database = kegg | pathway | brite | module | ko | genome | genes | org | vg | ag | ligand | compound | glycan | reaction | rclass | enzyme | network |
variant | disease | drug | dgroup | environ
示例 : 查看pathway 数据库的基本信息
pathway KEGG Pathway Database
path Release 85.0+/03-11, Mar 18
Kanehisa Laboratories
570,005 entries
linked db module
ko
genome
<org>
compound
glycan
reaction
rclass
enzyme
network
disease
drug
pubmed
list
列出数据库中所有的记录,或者列出指定条目的记录
对于list 操作,共有3种不同的URL 格式
第一种,查看数据库中所有的记录
http://rest.kegg.jp/list/database
database = pathway | brite | module | ko | genome | org | vg | ag | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | organism | medicus
示例:查看所有ko的信息
ko:K00001 E1.1.1.1, adh; alcohol dehydrogenase [EC:1.1.1.1]
ko:K00002 AKR1A1, adh; alcohol dehydrogenase (NADP+) [EC:1.1.1.2]
ko:K00003 E1.1.1.3; homoserine dehydrogenase [EC:1.1.1.3]
第二种,只针对pathway和 module 数据库 ,查看特定物种的信息,格式如下
http://rest.kegg.jp/list/database/org
database = pathway | module
示例:查看human对应的所有pathway 信息
path:hsa00010 Glycolysis / Gluconeogenesis - Homo sapiens (human)
path:hsa00020 Citrate cycle (TCA cycle) - Homo sapiens (human)
path:hsa00030 Pentose phosphate pathway - Homo sapiens (human)
第三种,查看数据库中的某几条记录,使用数据库中的标识符进行查找,多个标识符用+ 链接,最多1个URL 中允许查找10个
http://rest.kegg.jp/list/dbentries
dbentries = Entries of the following database
database = pathway | brite | module | ko | genome | org | vg | ag | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | medicus
示例:查看pathway 中 map00010 和 map00040 的信息
path:map00010 Glycolysis / Gluconeogenesis
path:map00040 Pentose and glucuronate interconversions
find
find 用于在数据库中根据关键词进行查找, 格式如下
http://rest.kegg.jp/find/database/query
database = pathway | brite | module | ko | genome | genes | org | vg | ag |
ligand | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | medicus
示例:根据关键词 shiga和toxin 查找相关的基因
ece:Z1464 stx2A; shiga-like toxin II A subunit encoded by bacteriophage BP-933W
ece:Z1465 stx2B; shiga-like toxin II B subunit encoded by bacteriophage BP-933W
ece:Z3343 stx1B; shiga-like toxin 1 subunit B encoded within prophage CP-933V
关于后面4种操作的用法,我们下一篇进行介绍,今天就到此为止。