写在前面
类似的主题,我们已经推出了一篇主题为《一键完成共线性(MCScanX)分析》的文章。推出之后一部分人用着挺好。也有相当部分朋友却不知为何遇到各种各样的问题。这些问题,源于输入文件的类型,格式变化过多,以至于需要用户对软件输入文件的基本格式有了解。此外,分析门槛的降低,使得大家更快更好更容易地得到流程结果,但更多人却卡在可视化这一步。
事实上,我认为在这些地方卡住的朋友,应该选择放弃。有一些分析,本来就不需要做;或者有一些分析,应该选择与人合作;每个人应该做自己擅长的事情,将时间投入到自己不擅长的事情上,并不是不能变得擅长,而是在于你投入的时间成本与收益会明显不成正比。
当然,我最不想看到的是,TBtools,你居然都不会用?我写的软件,追求的是任何人,打开软件就会使用,因此,我最厌倦的是有人居然打开了不会用,更甚至是用错了,却将问题归结于软件。
我并不是没有时间一一怼回去,而只是懒得跟这些朋友折腾,这明显是在浪费我的时间。
但是,无论如何,你往往改变不了其他人。你能做的是,改变你自己。毕竟,后者的成本更低。
解决办法
基于近期看到的这个问题,也在管理员@百合 的建议下,我对这个功能做了一些修改,主要是尽可能确保,主要用户提供正常的gff3和基因组序列文件,那么功能就一定能正常运行,而且运行结果一定不会有错。
现在更新后的版本,跟之前的输入完全一样,需要用户提供四个输入文件(事实上,这些文件,你可以直接在网络上直接下载,解压后直接用于输入,不需要你做,也希望你绝对不要做多余的操作)
- 物种1 - 基因组序列文件(请不要输入基因序列文件,如果不知道差别就不要用了)
- 物种1 - 基因结构注释信息文件
- 物种2 - 基因组序列文件
- 物种2 - 基因结构注释信息文件
打开TBtools
设置输入文件,然后点Start
可能会弹出这类提示,
这是告诉你,你的注释见中,存在三个序列其实并没有CDS注释,换句话说,其他的都没问题,不用管。跑完就是了
提示:
- 如果你是要做物种内的共线性,那么物种1 和物种2 完全一样的输入,支持。
- 你输入的是gff3 或者 gtf,那么软件会处理,也支持。
- 如果你的染色体id或者基因id在两个物种之间有重复(尤其是当你是从NCBI下载两个物种的基因组序列和注释信息),那么软件可以正常处理,会自动检测并加上随机数字,所以,也支持
- 如果你输入的基因结构注释信息,其中没有CDS的注释信息,那么请你放弃。
绘图文件支持
如果只是完善前述的功能,我们并没有再多余地写一篇推文,因为这看起来毫无意义。我写的功能,我自己也使用,我当然能注意到这些功能用起来到底够不够爽。很明显,一方面我觉得一般,另一方面,我真是厌倦了各种各样的问题:
- 怎么准备ctl文件,我要做两物种的共线性可视化
- 为什么我按照格式准备了文件,可视化的时候会报错?
Emmmm....我真是受够了!于是我在这个 OneStepMCScanX 功能的输出中,直接输出一定可以用于可视化的几个文件。
其中红色是DualSyntenyPlot可用的输入文件,绿色的是MultipleSyntenyPlot可用的输入文件。
所以你要可视化,很简单。打开TBtools
你需要做的,可能是修改下顺序,或者去掉一些不想展示的染色体,(编辑.ctl文件)
如果你后续是想用多物种的,那么这里提供了当前两个物种的可视化文件,你可以用于跟其他结果合并,然后再可视化
剩下的,看你自己了
写在最后
我只是不想回复任何使用问题,或许最好的办法是让使用问题不可能出现。