一起玩转HiC格式转换

日常瞎掰

  五一放假了么?
  放了!好像又没放。无所谓了,反正已经禁足快五十天了,都已经失去知觉了!有一种“不知天上宫阙,今夕是何年”的朦朦胧胧的恍惚!
  《那年那兔那些事》这个讲述抗战的历史小动漫,现在已经记不起自己何时何地因何第一次接触到这个动漫的了,但它给我的感觉还是依然很清晰。说不清因为什么自己这么印象深刻,或许是引起了内心的爱国情怀,但更多的应该是受到了当时人们为了追求和平所做出的巨大牺牲的冲击,也许那种同仇敌忾、勇往无前的情怀才是最深入人心的印记!世上并没有感同身受,而时间又是治愈一切的良药,那么应该如何保持初心呢?
  今天为何会说到那兔呢?答案很简单,因为无意中看到了关于那兔的小视频,看到这个一点都不感到惊讶,因为现在分享各式各样的视频都有,其实心里早有预感,这个动漫迟早会被拿出来分享——《那年那兔那些事》。
  那时候的,小钱钱,真心甜!

格式知多少

  好了,现在要从大国情怀回到现实了,说点大家唾手可得的东西。关于HIC技术想必大家应该有所了解了,不了解也没有关系,反正这里我也不会介绍。那我们就一起外行看个热闹吧!
  分析HIC的软件各式各样,这里就列举一二:juicerhomerhic-prohicexplorer等,这些软件的好坏这里就不做评论了,但是要吐槽一下格式不统一的情况。都是分析HIC,这些工具产生的结果的数据格式却大相径庭。这里也列举一二:.hiccoolhomerhic-pro的六列文件hdf5等。这些不同的格式(天知道为什么会弄出这么些格式)着实给数据处理带来了不少的麻烦,毕竟这些格式基本上都属于二进制的文件,想要轻易预览里面的内容,根本没有的事。那么,格式转换是必然面临的问题了,因为没有一款软件可以满足你的全部需求,只能根据需要来转换成软件接受的文件格式。
  当然,也不必惊慌,既然有需求,那就会有人来实现这个解决办法,就比如hicexplorer软件就有格式转换的功能,基本覆盖上面提到的格式了,hicConvertFormat

usage: 
hicConvertFormat --matrices MATRICES [MATRICES ...]
                 --outFileName OUTFILENAME [OUTFILENAME ...]
                 --inputFormat {h5,cool,hic,homer,hicpro}
                 --outputFormat {cool,h5,homer,ginteractions,mcool}
                 [--correction_name CORRECTION_NAME]
                 [--correction_division]
                 [--store_applied_correction]
                 [--chromosome CHROMOSOME]
                 [--enforce_integer]
                 [--load_raw_values]
                 [--resolutions RESOLUTIONS [RESOLUTIONS ...]]
                 [--help]
                 [--version]
                 [--bedFileHicpro BEDFILEHICPRO [BEDFILEHICPRO ...]]

  现在格式转换的问题基本迎刃而解,转换的时候只需一行命令就可以完成。但这里还是想要单独强调一下.hic这个格式,这个格式可以包含多个分辨率的交互矩阵,转化格式的就应当特别注意一下。这里也顺便提一下,其实cool也有多分辨率结果的格式,即mcool。故.hic格式可以直接转化为mcool,然后由mcool再提取其中一个分辨率的结果就是cool
  hicConvertFormat转化格式的命令,基本形式如下:

hicConvertFormat --matrices sample.h5 --inputFormat h5 --outputFormat ginteractions --outFileName sample.gi.tsv

  使用上面的命令,基本满足任何从inputFormatoutputFormat的转化,但这里还是指出一个特殊情况,hicConvertFormat只能将.hic直接转为cool,不能是其他格式,不信你看:


  上面是hicConvertFormat的部分代码,可以看出.hic可以直接转化为cool,利用的是hic2cool这个软件。如果用hicConvertFormat命令将.hic到其他格式,需要先转为cool/mcool作为中间格式,然后再转换为需要的格式。下面演示一下如何查看mcool里面的结果:

cooler ls sample.mcool

结果如下:

sample::/resolutions/1000
sample::/resolutions/5000
sample::/resolutions/10000
sample::/resolutions/25000
sample::/resolutions/50000
sample::/resolutions/100000
sample::/resolutions/250000
sample::/resolutions/500000
sample::/resolutions/1000000
sample::/resolutions/2500000

  从上面的结果可以知道mcool里面都有哪些结果,这样就可以有选择性地做格式转化了:

hicConvertFormat --matrices sample.mcool::/resolutions/25000 --inputFormat cool --outputFormat h5 --outFileName sample.h5

结束语

  hicexplorer的格式转化功能已经挺完善了,基本上可以玩转HiC的数据格式了。不过,这里还想提一下straw(安装有些费力)和cooler两款软件,前一个软件可以直接将.hic转为txt格式,后一个软件可以直接将cool转为txt,得到了txt文件后续处理起来便可以随心所欲了。格式统一是不可能了,但有了这些工具的支持,基本上也是可以玩转HiC的格式转化了。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容