导语:
前面的推文简要介绍了Jalview的大体功能,本以为对该软件的需求不会很大。但是随着这几篇推文“,”中发现的一些问题,今天有必要对Jalview这款多序列比对软件的具体使用进行介绍。
为了使得这篇推文相对完整,就把之前的内容搬过来了。
俗话说得好:人靠衣装,佛靠金装。
科研作图亦是如此,随着各类软件的发展和科研工作者的审美不断提高。
如果不给你的图片做个“美妆”还能不好意思拿出去见人,更不好意思放在你的paper中。
接下来就介绍一个软件,用以对对序列比对结果进行美化和编辑,可以让你的多序列比对图片瞬间高大上。
从此你做的图就是颜值担当!
今天的主角是jalview
【进入正题】
1、软件下载安装
https://www.jalview.org/
该软件支持多种操作系统,各位根据需要自行下载安装即可。安装方法与普通软件的安装方法相同,一路next即可。
但该软件依赖于java,因此首先需要安装java。
另外,由于该软件可与EML、PDB等网站互联,因此在使用web功能时需要联网。
2、软件的功能
下图所见即为该软件的功能展示,是不是很强大。
3、软件的使用
打开软件后,就会自动弹出这些界面,这是该软件的内置信息,目的就是为了展示该软件的主要功能及可视化效果,载入我们自己的序列时,全部关闭即可。可以通过下图大致看到,可以实现以下功能:
对多序列比对结果进行高颜值的着色;
显示保守区间和比对质量;
可对序列进行快速编辑;
对选中的序列构建进化树;
显示选中序列的蛋白结构或二级结构,等。
下面开始具体操作。
使用方法
1、导入序列
这一步可选格式很多,这里以Fasta格式为例。示例序列还是用之前的Athsp20.fasta。
导入之后初始图片如上。
2、比对之前进行简单修饰
(对第2步的简单说明:如果这里导入的是已经由其他软件比对之后的序列,则有必要执行第2步;如果导入的是未经比对的原始序列,则没必要执行第2步,因为在Jalview进行比对后,会重新生成这四行注释信息。)
从上图看到下面的条形图,其实就是比对注释信息,通常来说我们不需要这些信息,因此,为了便于后续的多序列比对和美化,这里选择隐藏掉序列下方的四行注释信息。
效果如下:
3、多序列比对
这一步会让很多人犯难,我写到这一步的时候也花了一些时间。直接上图:
3.1 为了不显得突兀。这里我先用DNAMAN默认算法进行比对。
3.2 再用MEGA X-Muscle
由于MEGA无法导出序列比对图片,所以这里就截图拼起来看。
3.3.1 使用Jalview-Muscle with Defaults
(为了统一起见,下面的color使用clustalX的配色方案)
Muscle with Defaults比对结果
3.3.2 使用Jalview-Muscle with Defaults
注:3.3.1和3.3.2都使用Muscle,两者比对结果是一致的,但与3.1中DNAMAN比对的结果略有不同。不论是DANMAN还是Jalview,至少在序列比对这一步,都没有错。只是因为比对策略和默认参数设置不尽相同才导致上述结果的差异。
3.4.1 使用Jalview-Mafft with Defaults
以前没有认真了解Jalview,刚才比对的时候才惊奇的发现,这里居然有mafft。那我肯定要体验一下。
注:相对来说我比较满意Mafft with Defaults比对的结果,这个满意,我的主观意愿占据了很大比重。科学依据将在以后专门写。
3.4.2 mafft命令行比对结果可视化
命令行选项中,默认比对策略为FFT-NS-2,所以这里我们就选择默认FFT-NS-2。但是不知道Jalview中mafft的默认比对策略是什么,这里就先不考虑了,我们暂且使用FFT-NS-2。
然后将比对结果导入Jalview进行可视化。
注:3.4.1和3.4.2的比对结果一致,说明刚才的默认策略选择一致。当然,这里mafft还提供了其他比对策略,就不一一看了。毕竟这也不是今天的重点。
小结:Jalview中除了上述提及的比对策略,还有很多其他的比对策略,就不一一比对了,很多情况下我可能用不到。
重点:可以看到,上述选择了不同策略之后,其直接影响最终比对结果的不同,不论选择哪一种比对策略,都不能用对错来衡量,至于具体哪种情况下应该使用哪种最优策略,这一点我还不能解答,但弄清楚这个问题显然很重要。
小小挣扎:
最终我还是选择使用mafft中的自动选择进行查找最优策略挣扎一下。
好吧,就先到这里吧,一时半会儿我也搞不清。
继续下一步。
4、美化和编辑
(美化和编辑就以最终小小挣扎的结果进行)
4.1 序列一行显示太多了,将序列分行显示
看效果
貌似没有变化,其实已经打开了分行模式,此时只需要按照自己的需求缩放这个窗口即可自动换行。比如下面这样就好多了。
4.2 更改配色方案
这里我选择的是ClustalX,感觉总体还算体面。这一列菜单都是颜色设置选项,方案很多,功能很强,可以自行选择合适的方案。
下面展示几种不同的配色:
4.2.1 给不同的氨基酸自定义颜色
4.2.2 灰黑
4.2.3 根据保守性
4.3 font和size设置
通常来讲,多序列比对结果中的字体推荐Cambria、courier New(DNAMAN Default),字号为14或16.
感觉怪怪的,换一个
还不错,关于字体,我还是选择DNAMAN的默认字体courier New吧,看着比较舒服。
4.4 几处显示设置
4.4.1 隐藏scale left
4.4.2 隐藏Show Sequence Limits
5、几个小技巧
5.1 对序列进行排序
这里有四个选项可供选择,当然在导入fasta序列时也可提前设置好先后顺序。
5.2 删除不想展示的区段
选中后直接Delete即可,比如这里我只展示这一部分。
5.3 间隔太大怎么办?比如下面这样:
解决方法:鼠标移动至空白处,即可左右拖动。
6、导出图片
最终效果:
看起来还不错。
好吧,卸载DNAMAN……
本文使用 文章同步助手 同步