推荐首先研读官方github教程 Juicebox Assembly Tools
(注意红色圈出部分字段,仔细阅读,对照查看本文实操视频和中文解释)
A note on this, .final and .FINAL are actually different suffixes: the first one does not include gaps between individual original scaffolds, and the latter does. Just make sure you load .hic and .assembly with the same suffix.
注意事项:
- Juicebox的编辑功能在导入了assembly文件后放大scaffold块,放大到足够大的时候才能出现编辑的剪刀(注意是在有scaffold边界的地方进行分割才会成功),进行分割染色体区域(在新版1.11.08中,是采用shift点击边界后选择add chr boundaries)
- 如果要去掉某些散在区块中的空白区域则需要放大到足够大后,用shift+左键选中空白的区域进行剪切去掉
- 这些需要剪切的空白区域其实是表明这些contig和谁都没有关联,会在1-3.hic的步骤中被去除,相应的最终的.hic文件得到的hic组装结果能挂载到的基因会减少
- 但是如果0.hic的结果太差,可以试用3.hic的结果,也许会更好,有提升功能,如果挂载的基因不太少的话,会很好
- hic的最终assembly是(rawchrom.assembly)
00.nextpolish.final.assembly -> 00.nextpolish.rawchrom.assembly
- 通常来讲,用final.hic对应的结果去进行染色体区块编辑后再进行染色体水平的基因组组装
run-asm-pipeline-post-review.sh
,得到fasta的文件,然后再通过已经注释的contig版本的基因组基因的坐标信息,对应上染色体水平的基因组基因信息 -
当出现如下图的3dDNA组装偏差时,即交互区域分布于对角线之外,则可人工校正,下图中1号和3号之间有间接关联,需要将1号shift选中后放入2-3边界处,在边界处放大到足够大时会出现对角箭头可以实现位移。
7.对于信号不是呈现对角线处最强的情况可进行shift选择色块后用翻转箭头工具进行对称翻转。
写在结尾
a. 关于ALLHiC组装,可以用3d-dna得到的最终基因组fasta结果再用ALLHiC进行组装,相当于基因组已经经过了3d-dna的纠错,得到的可能是更加准确的包含N的基因组序列,再经过ALLHiC进行打断去除N,得到更好的结果
b. 关于juicer_tools.jar的使用
java -jar ./juicer_tools.2.20.00.jar
WARN [2022-12-20T21:05:37,105] [Globals.java:138] [main] Development mode is enabled
Juicer Tools Version 2.20.00
Usage:
dump <observed/oe> <NONE/VC/VC_SQRT/KR> <hicFile(s)> <chr1>[:x1:x2] <chr2>[:y1:y2] <BP/FRAG> <binsize> [outfile]
dump <norm/expected> <NONE/VC/VC_SQRT/KR> <hicFile(s)> <chr> <BP/FRAG> <binsize> [outfile]
dump <loops/domains> <hicFile URL> [outfile]
pre [options] <infile> <outfile> <genomeID>