零基础快速完成基因功能注释 / GO / KEGG / PFAM...

写在前面

早前已经推过《新手eggNOG-Mapper详细教程》,但仍然有很多人遇到使用问题。换句话,可能那个教程不能彻底解决大伙遇到的问题。于是我决定写一个完美的教程,彻底解决大伙的基因功能注释问题。
eggNOG-mapper 大名鼎鼎,是一款非常全面,高效,准确,且一直在更新的软件,对应的,该团队提供了网页接口,任何人可以提交蛋白序列文件,在极短的时间内(一般几分钟)完成基因功能注释,包括:
1.具体功能描述信息
2.Gene Onotoloy注释信息
3.KEGG 注释信息
4.PFAM 注释信息
5.以及其他...

今天的这份教程,会让任何人看过之后,就完全可以掌握注释方法,而且可以得到用于基因功能富集分析的输入文件,如GO富集分析、KEGG富集分析等。这或许是不少 TBtools 用户的烦恼。
回到主题,教程分为两个部分:

  1. 如何使用 eggNOG-mapper 进行基因功能注释
  2. 如果使用 TBtools 软件一键整理基因功能注释结果

eggNOG-mapper 注释

首先,基因功能注释质量好坏取决于数据库质量高低,是否全面。于是,本地化进行基因功能注释,需要收集尽可能多的数据库(这个其实很不实际),也需要有较好的计算资源。通过使用网页服务工具,可以克服这个问题。我们可以一直使用最新最全的数据库,同时不需要消耗本地计算资源。
在 eggNOG-mapper 上进行基因功能注释,非常简单。
第一步,打开 eggNOG-mapper 主页

http://eggnog-mapper.embl.de/

看到下图



参考上图,其实需要做的事情非常简单:

  1. 选择输入模式,一般是输入蛋白序列
    2.选择本地输入文件,即蛋白序列集合(这个完全可以基于基因组序列.fa和基因结构注释文件.gff3/.gtf用TBtools提取)
    3.给定一个邮箱地址(注意,这个非常重要,需要进入邮箱才能启动任务
    4.点击 Start

等待文件上传,一般大概不到一分钟,弹出页面


随后,检查自己的邮箱,可以看到如下


打开收到的邮件,其中有“Click to manage your job”,点击即可看到(如果点击进去,看不到任何东西,那么请复制该链接,使用 谷歌浏览器 、火狐浏览器、edge浏览器 任意一个打开)

点击 “Start job”即可,然后可以去打球或者去休息,上个洗手间等等。
任务完成时,会自动发送邮件到邮箱,当然也可以选择过几分钟来看看这个页面

这是我昨天邮箱里的邮件,也是此次的示例文件来源

进入任务完成的邮件,可以看到

建议直接点击第二个链接下载我们需要的文件,但是你也可以打开第一个文件,那么会看到

最后还是会进入文件下载链接,看到如下

下载的是一个制表符分隔的文本文件,你可以用 Excel 打开,结果如下

结果很全面,只是还是不能满足我们的需求,或者说,这里开始可能才是不少 TBtools 用户遇到的问题。那就是怎么整理这些信息,用于TBtools的 GO富集分析或者KEGG富集分析?

eggNOG-mapper Helper

为了解决这个问题,我想来想去,还是谢了一个功能,就叫 eggNOG-mapper Helper,可以一键直接整理 eggNOG-mapper 的结果,输出几个文件,分别满足不同下游分析需要。
功能如下,注意更新到 v1.9868 或更高版本



打开该功能,可见非常简单的输入界面



使用非常简单,具体示例如下

输出文件中,大家可能最关注的有四个:
out.emapper.annotations.description.txt,对应的功能文本描述
out.emapper.annotations.GO.txt,对应的是GO注释结果,可直接用于 TBtools GO富集分析,当注释背景文件
out.emapper.annotations.KEGG_Knum.txt,对应的是KEGG注释结果,可直接用于 TBtools KEGG富集分析,当背景注释文件
out.emapper.annotations.pfam.domain.txt,对应的是PFAM结构域注释,注意,这个注释结果是定性的,即有无某结构域,如果一个序列有多个相同结构域,只会显示一个

四个文件的具体信息,截图可看



(注意,尽管我使用 Excel 打开,但这些文件仍然是制表符分隔的文本文件,千万不要保存为 Excel 格式,以免有后续问题)

写在最后

Emmm... 很久没有写教程了,不过我觉得这个教程应该还是比较详细,完全可以解决几乎所有人的 GO 或者 KEGG 甚至是基因功能注释的烦恼。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,793评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,567评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,342评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,825评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,814评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,680评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,033评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,687评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,175评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,668评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,775评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,419评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,020评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,206评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,092评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,510评论 2 343

推荐阅读更多精彩内容