Tips | 提供JBrowse浏览器 = 公开了基因组!

写在前面

早晨,一个老朋友(也是 TBtools 的老用户)与我联系,大体是问了我一个事情gbff转gff3是否可以用TBtools?答案当然是可以,但我不建议。主要原因有二:

  1. 使用gbff,往往是基因结构注释很不完善
  2. gbff格式常常有变化,不一定有CDS等注释,可能只是一个记录信息

TBtools很早就有这个功能,但我没开放。也就这两个原因。但毕竟是老友,帮个小忙理所应当。我拿到他发来的gbff文件,用TBtools转化了一下,发现空文档。所以非常遗憾,无解,因为他下载的gbff文件(NCBI)本身就不记录 CDS 或者说基因结构注释信息。
那咋办?

找基因组网站

按理说,一个基因组文章发表,会对应一个基因组数据库。于是我还是帮忙搜索了下,尽管他并没有提起。果不其然,确实存在。板栗基因组数据库



那么一切似乎就理所应当。基因组数据库总是会提供下载链接的。鼓捣了一会,发现,事情并没有按照我的想法发生。而是



也就是下载不了。我当然不会死心,再看看是否有其他下载链接。因为这个数据库明显就是在共享数据,作者团队不想共享,那么就不会有这个数据库啊。

然而,还是非常遗憾。这是一个FTP链接。估计后台服务崩溃了。
总结一下,下载数据是不可能的了。估计还是得先写个邮件告知下网站维护人员。

基因组浏览器 JBrowse 是可用的

Emmm,原本我是打算就这样吧,反正朋友自己去写邮件就行了。也没啥。但突然看到电脑旁边的一袋板栗,吃起来还是很爽。要不就再试试。于是我点开了数据库网站的 JBrowse。OK,这个是Work的。



情况变得越来越有趣:

  1. 我们知道,JBrowse可以直接下载当前区间的序列
  2. 一个染色体的序列,由所有区间合并而成

OK,一切变得简单。只需要查看后台(Ctrl+F12,如果你是用Chrome),我们就可以知道,JBrowse传递序列的 API 调用方式。



尽管我们看到了可能可以下载这个染色体序列的选项,但灰色,表示,老铁,你下载不了。



没关系,那就直接下载区间。

于是你会看到“Chr1-2.txt”等字样,以及右侧他的获取连接。换句话说....一切过于简单。稍加分析就会发现:每一个 Chr1-X.txt 记录的是 20kb 的序列。问题就好办了。尽管不能下载,染色体长度我们是知道的。



计算一下,即可知道,一共是 4669 个文件。
perl -le 'print qq{system http://castaneadb.net/jbrowse/data/json/cm_hby2/seq/a2f/6a9/19/Chr1-$1.txt} for 1..4669'

一个命令,搞定一条染色体。
统计一下结果,发现总长度是

file format type num_seqs sum_len min_len avg_len max_len
Merge.Chr1.fa FASTA DNA 1 93,341,109 93,341,109 93,341,109 93,341,109
比预想少了20kb。这就尴尬了。我拿起了一个板栗,咬开之后,就嚼了起来。哦,难道说?Chr1-0.txt?
于是测试了下

wget http://castaneadb.net/jbrowse/data/json/cm_hby2/seq/a2f/6a9/19/Chr1-0.txt

发现,确实如此。也就是 JBrowse 从 0 开始计数。OK。一切就是这么简单。
其他染色体一样的操作就可以搞定。

获得完整的染色体列表


然后自己折腾就可以了。


注释信息文件,一样的操作。Perfect!

写在后面

Emmm,前前后后,还是花了个把小时....今天内容就这么多了。祝大家科研顺利。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343