该模块主要用于KEGG分析以及作图。首先,需要得到相应基因的KEGG以及KO IDs:
输入文件是先前的比对文件,选择近缘物种,然后保存并命名,之后点击“search”,会出现两个文件:
第一个是你命名的文件,第二个是标记着KO的文件。第一个文件含有的是基因ID以及对应的KEGG ID,第二个是基因ID; KEGG ID; KO ID以及功能,如下:
同时,因为这个文件含有大量信息,有的时候会比较大,打不开。这个时候别慌,选择后面的:
你想要哪些内容,你就选择哪些内容,然后点击“extract”提取就好。结果如下:
之后将产生的只含有基因ID以及KEGG ID 的文件拖入进来:
便可得到KEGG对应的功能。如下:
旁边那个按钮可以给你提供一份简化版的注释信息,比如:
如果使用简单数据库,则后面的信息会只保留kinase,具体想要哪些信息,同学们根据需要选择。
再就是可视化。我们先说一下网络图。例如下面这个:
具体操作是:
把上述过程得到的KEGG的功能文件,放入① (当然,因为一个基因往往在多个过程中发挥作用而功能文件又含有很多基因。所以信息会很复杂,在这里我建议同学们只展示需要展示的几个基因,或者只展示需要展示的几个功能,全部放进入不是不能做而是不好看,我们写文章提供给别人的信息应该是明确的,清晰的~),点② format一下,之后在③处选择一个颜色模型,其他参数可以暂时不用管,然后点击④,就可以进行绘图。
再说一下,热图。
这里往往不会很精彩,能够提供的是如下所示的类型:
展示了在哪些过程有哪些基因。
具体操作:
首先还是格式化文件,这里的格式化是对你的文件中的功能进行一个统计:文件放入①,点②,设置保存并命名文件③,之后点击“statistics”即可完成。
然后将统计完的文件(当然,同学们也可以用其他软件对该文件进行一个绘图,反正,统计的结果是一样的,只是具体的可视化方法不同而已)放入④,选择一个颜色模式⑤,点击⑥就可进行绘图~