Ensembl webpage 是一个综合性的基因组数据库,包含了来自多个物种的基因组序列和基因注释。它的数据库中涵盖了多种物种的完整基因组信息,使得跨物种基因比较成为可能。该数据库定期更新,并且经过严格的验证过程,确保基因注释和同源基因预测的准确性和可靠性。新的基因组数据和注释信息会不断加入到 Ensembl 中,使得它能够提供最新和最全面的同源基因信息。因此,在进行跨物种的比较组学分析时,我们可以选择将 Ensembl 网站提供的可靠跨物种 同源基因信息 作为标准参考。
通过 Ensembl webpage 获取跨物种同源基因信息,主要包含以下10个简单的步骤1,
以获取 GRCh38
到 Crab-eating macaque
的基因同源映射为例:
1. Go to: https://www.ensembl.org/biomart/martview
2. Choose Ensembl Genes 112
3. Choose Human genes (GRCh38.p14)
4. Click on Filters
in the left menu
5. Unfold the MULTI SPECIES COMPARISONS
box, tick the Homolog filters
option and choose OrthoIogous Crab-eating macaque Genes
from the drop-down menu.
6. Click on Attributes
in the left menu
7. Click on Homologs
8. Unfold the Crab-eating macaque Orthologues
box and select the data you want to get (most probably the gene ID and maybe the orthology type as well).
9. Click on the Results
button (top left)
10. Choose your favorite output: tsv
, check box next to Unique results only
此处提供一份转换好的文件以供学习使用:
【GRCh38.14 👉 Macaca fascicularis】:https://download.csdn.net/download/Nh_code/89570340
Note:
如果要查询人类 hg19(CRCh37) 的映射,将以上步骤 1 中的链接替换为 hg19 的 Biomart 数据库:http://grch37.ensembl.org/biomart/martview/5eea26d2bdd92b9e2d90147b49371e38】
目前由于Ensembl选择GRCh38作为其主要参考版本,Hg19的跨物种同源基因信息目前在该数据库已检索不到:
Reference
Ensembl Compara | InterMine Server Documentation
How to get ortholog gene list from ENSEMBL (github.com)
ensembl.org/biomart/martview/af091ef3e243fa9c4c00860ee86b4b88