Ensembl和NCBI基因组下载,基因序列下载查看

如今大量物种参考基因组数据已被公布,对于科研工作者,可以说是一笔巨大“财富”。那么该如何获取这笔“财富”呢?

本期将介绍几个相关的数据库,并举例演示如何查找和下载到想要的参考基因组及参考基因组得注释信息。

查找参考基因组得常用数据库

1.Ensembl

        是由 European Bioinformatics Institute(EBI)与Wellcome Trust Sanger Institute(WTSI)共同合作开发的数据库项目。涵盖大量物种的参考基因组信息,并且数据更新及时,是参考基因组下载的好选择。

动物参考基因组:http://asia.ensembl.org/index.html

植物参考基因组:http://plants.ensembl.org/index.html

其他真菌细菌等参考基因组:http://ensemblgenomes.org/

2.NCBI

    是National Centerfor Biotechnology Information的缩写,指美国国立生物技术信息中心。NCBI的全面和强大,相信大家都深有感触,NCBI在参考基因组信息展示上同样表现出色。

地址:https://www.ncbi.nlm.nih.gov/

详细下载方法:http://www.omicsclass.com/article/497

3.UCSC

UCSC Genome Browser是由University of California Santa Cruz (UCSC) 创立和维护的,主要收录一些模式动物得数据库,尤其是人和鼠参考基因组较常用;关于人的基因组注释信息非常全面;

地址:http://genome.ucsc.edu/cgi-bin/hgGateway

4.phytozome(JGI)

主要收录绿色植物基因组的数据库,主要用于植物比较基因组学分析,收录的植物基因组及注释信息很全面,也是一个不错的植物基因组下载数据库;

地址:https://phytozome.jgi.doe.gov/pz/portal.html

5.其它:

    一下单一物种的基因组数据库;拟南芥,TAIR是位于美国的拟南芥信息资源网站(The Arabidopsis Information Resource, TAIR)(http://www.arabidopsis.org/);水稻的http://rice.plantbiology.msu.edu/等;

老师在确定参考基因组分析项目的时候,一定要指明自己所用的参考基因组下载地址和版本,因为各个数据库会有各自的一套基因ID,如果用错了参考基因组,由于基因ID的不对应会对后期结果的查看造成不必要得麻烦;

这么多的数据库,各有优缺点,该如何选择合适的参考基因组下载地址呢?针对物种全面程度,和基因组注释信息的详细程度,以及易用性,小编首推Ensembl数据库,今天就来分享一下Ensembl数据库得应用;在接下来得推送也会介绍NCBI和JGI数据库的使用;

Ensembl数据库下载参考基因组

下面以植物拟南芥为例:

1.进入网站:http://plants.ensembl.org/index.html

一些常用的物种列在首页 拟南芥,水稻,玉米等 如果想要得物种不在首页可以点击:View full list of all Ensembl Plants species ;可以得到所有物种的列表;

2. 点击进入拟南芥参考基因组介绍页面;

可以看到拟南芥基因组的介绍信息:

3.下载参考基因组:点击Download DNA sequence (FASTA)

一般我们下载*toplevel.fa.gz文件,为参考基因组完整文件,其他rm,sm,和分开染色体得文件;sm和rm的意义可看README文件,介绍如下,为repeat区不同mask方法:

'dna_rm'- masked genomic DNA.  Interspersed repeatsandlow    complexity regions are detectedwiththe RepeatMasker toolandmasked    by replacing repeatswith'N's.

'dna_sm'- soft-masked genomic DNA. All repeatsandlow complexity regions    have been replaced with lowercased versionsoftheir nucleic base

4.基因蛋白质和cds序列文件的下载:

在上一步的网址下,点击  转到高层目录:就可以看到cds和蛋白质pep等的下载

5.基因注释文件gff和gtf文件的下载:

在上一步的基础上继续点击两次转到高层目录:可以看到gff和gtf目录,点击进入到自己想要的物种下载对应的文件即可:

高级应用:

浏览拟南芥一个基因的位置:直接搜索基因名AT2G02740

2. 搜索到该基因的信息:

3.点击基因名得到详细信息:具体位置,不同转录本的位置及信息:

4.查看其中一个转录本序列信息,下载该转录本的蛋白质或者cd序列:

下面是该转录本的详细信息:

总结:

Ensembl 网址收录的基因组全面,下载方便,在线可视化做得也不错,当然由于篇幅限制只能介绍一些简单的应用,还有其他一些实用得应用如blast搜索一些同源基因;BioMart :支持用户个性化的筛选基因组上的注释信息,如指定区域的基因,GO注释,不同数据库的基因ID等等信息,非常强大,有兴趣者可尝试使用。

更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读OTU网络图绘制cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课,学习链接:linux系统使用perl入门到精通perl语言高级R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析GEO芯片数据挖掘GSEA富集分析课程TCGA临床数据生存分析TCGA-转录因子分析TCGA-ceRNA调控网络分析

8.其他课程链接:二代测序转录组数据自主分析NCBI数据上传二代测序数据解读

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,830评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,992评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,875评论 0 331
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,837评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,734评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,091评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,550评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,217评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,368评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,298评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,350评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,027评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,623评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,706评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,940评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,349评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,936评论 2 341

推荐阅读更多精彩内容