【原创】在NCBI查找指定物种基因组信息
生信分析中经常需要查找指定物种的基因组信息。如:基因组相关分析中需要借助已有基因组辅助基因组组装及基因预测;转录组同样查找已有基因组作为参考基因组;宏基因组/宏转录组同样需要查找基因组来剔除宿主数据,等等。。。
本文仅以目前最常用的综合性基因组数据库 NCBI 为例,演示下基本的物种基因组检索方法。
1、获取物种拉丁名
这个方法有很多,最常见的百度百科就基本可以满足绝大多数需求。
以 小菜蛾 为例:
找到 “小菜蛾” 的拉丁名为:Plutella xylostella
2、NCBI检索基因组
检索数据库选择 Genome;搜索框输入物种拉丁名 “Plutella xylostella”
点击 Search 后会跳转至 NCBI 推荐基因组,该基因组一般为组装结果较好或注释信息较全的基因组;
同时也可以看到,这里显示本物种在NCBI中共收录有7个基因组信息
3、全部基因组浏览
如果想要查看NCBI上关于本物种更多的基因组信息,可点击上图中的 “list” 链接:
进一步跳转至 “Plutella xylostella” 全部基因组浏览页面:
比较重要的几列信息如下:
第 1 列:物种信息
第 3 列:亚种、菌株等编号
第 6 列:对应基因组Assembly编号,点击可直接跳转对应基因组信息页
第 7 列:基因组组装水平,一般选取 Chromosome 或 Complete Genome 水平基因组
第 8、9、12、14 列:基因组组装大小、GC含量、序列条数、更新时间等信息
第 13 列:基因组CDS预测结果,确实则表示该基因组未进行CDS预测,即缺失基因信息
在这里即可根据自身需求选择合适的基因组进行相关分析啦~