「BioNano系列」混合组装时的冲突应该如何手动解决

「BioNano系列」光学图谱混合组装应该怎么做? 中的第二步是非常关键的一步,因为这一步是要发现组装中的错误,提高组装的准确性。

比如说下面就是我运行某个项目的输出日志,提示出现了18个BNG冲突,47个NGS冲突。

识别冲突

基础篇

Hybrid Scaffold流程如何定义冲突? 冲突的本质就是光学图谱和物理图谱上的标记存在过多无法匹配的情况。具体来说,AssignAlignType.pl统计每个联配中未联配的标记数,最大允许错配数可以在配置XML文件的assignAlignType.max_overhang修改。之后冲突信息记录在assignAlignType/conflicts.txt中。

conflicts

leftRefBkpt = 505987.0, rightRefBkpt = -1 表示该冲突左起于505987.0,但是后面就匹配的很好

发现冲突的下一步就是解决冲突。这一步调用的是cut_conflicts.pl, 他会检查conflicts.txt中记录的冲突位点,主要是分子的覆盖度(molecule coverage)和冲突标记附近的嵌合质量得分(chimeric quality scores).

嵌合质量得分用来评估组装的正确性。当该值低于设置的阈值,那么就会将光学图谱在该处进行切割,如果高于设置阈值,则切割对应的物理图谱。该阈值通过修改XML配置文件的cut_conflicts.min_quality_score_threshold设置。最终输出"conflicts_cut_status.txt "

conflicts_cut_status.txt 文件和 conflicts.txt 相似,多处几列记录用于记录冲突处理的策略。

  • ref_leftBkpt_toCut : 物理图谱左侧处理策略, cut 或 okay
  • ref_rightBkpt_toCut: 物理图谱左侧处理策略, cut 或 okay
  • ref_toDiscard: 是否保留该物理图谱, exclude 或 okay
  • qry_leftBkpt_toCut: 光学图谱左侧处理策略, cut 或 okay
  • qry_rightBkpt_toCut: 光学图谱右侧处理策略, cut 或 okay
  • qry_toDiscard: 是否保留该光学图谱, exclude 或 okay
conflicts_cut_status

应用篇

冲突这一步的解决策略我们在一开始设置的运行参数有关,-B设置光学图谱(genome map)处理策略,-N设置物理图谱(sequences)的处理策略,各自都有1,2,3三级。1表示不作处理,2表示在此处切割,3表示过滤掉冲突的contig。此外还可以用-M提供自定义的冲突解决文件。

举个例子,假如我们以-N 2 -B 2第一次运行流程,得到的结果文件可以导入到Bionano Access上肉眼检查。以在https://bionanogenomics.com/library/datasets/下载的NA12878 DLE-1 (PACBIO)数据集为例

可视化结果

对每个冲突检查之后,就可以修改assignAlignType/cut_conflicts/conflict_cut_status.txt, 有三种状态,okay表示不作处理,cut 表示切割, exclude表示删除该contig。如果你认为某处冲突是由于杂合度过高引起,那么就可以将其中一条contig用exclude标记删除

删除contig

最后编辑得到的文件,可以通过-M参数传入,再次运行。(不得有-f参数)

案例篇

运行后hybrid scaffold 流程之后,在Bionano Access对结果进行检查,通过选择逐个查看冲突,找到如下的冲突.

第一个记录中,左侧无法正确联配,右侧可以正确的配对

冲突的联配1

第二个记录中,左侧能够完好的配对,右侧无法正确的联配

冲突的联配2

我们可以查看对应的冲突信息, 当然由于-B 2 -N 2参数的缘故,冲突都是切割。

记录信息

如果我们仔细观察这个区域,你会发现标记的间隔大小相似,所以该区域很有可能是端粒区域,根据这个猜想,就是基因组不做切割,长的光学图谱contig右边进行切割,短的光学图谱contig左边进行切割。

为了修改方便,我将原来的conflict_cut_status.txt内容复制到Excel进行修改

原始

修改后

修改

按照相同的策略手动检查所有的冲突后,保存为制表符分隔的文本再一次运行即可。

参考

BioNano官方文档: Bionano Solve Theory of Operation: Hybrid Scaffold

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容