2021-06-29:Go注释的相关操作记录

主要参考:(4条消息) 无参转录组GO、KEGG富集分析——diamond+idmapping+GOstats_ygyxl的博客-CSDN博客

使用miniconda2安装Diamond之后,开始进行相关操作


1、建库

#下载swissprot数据库

wget ftp://ftp.ncbi.nih.gov/blast/db/FASTA/swissprot.gz

gzip -d swissprot.gz

diamond makedb --in swissprot -d swissprot

1、解压cds序列文件*.gz


2、blastx比对:

diamond blastx -d swissprot -q /vol3/agis/zhoushaoqun_group/wangyantao/GO/Sae_cds.fasta -k 1 -e 0.00001 -o /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_dia_matches.sae

出现报错:

The host system is detected to have 67 GB of RAM. It is recommended to increase the block size for better performance using these parameters : -b6

修改:

diamond blastx -d swissprot -q /vol3/agis/zhoushaoqun_group/wangyantao/GO/Sae_cds.fasta -k 1 -e 0.00001 -b6 -o /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_dia_matches.sae

diamond blastx -d swissprot -q /vol3/agis/zhoushaoqun_group/wangyantao/GO/Sme_cds.fasta -k 1 -e 0.00001 -b6 -o /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_dia_matches.sme

diamond blastx -d swissprot -q /vol3/agis/zhoushaoqun_group/wangyantao/GO/Sly_cds.fasta -k 1 -e 0.00001 -b6 -o /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_dia_matches.sly

diamond blastx -d swissprot -q /vol3/agis/zhoushaoqun_group/wangyantao/GO/Stu_cds.fa -k 1 -e 0.00001 -b6 -o /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_dia_matches.stu

紧接着下载注释用的数据库文件,获取idmapping.tb.gz文件和Uniprot2GO_annotated.py文件

报错

据说是python软件版本太低的问题

升级python

#升级conda#

conda update -n base -c defaults conda

#安装Python3.6

conda install python=3.6

#检测python版本

#重新尝试运行

~/miniconda2/envs/SolpanTP/bin/python3 /vol3/agis/zhoushaoqun_group/wangyantao/GO/unipro2go.py /vol3/agis/zhoushaoqun_group/caiyanling/yft/GO/idmapping.tb.gz /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_dia_matches.sae2 /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_go.sae

~/miniconda2/envs/SolpanTP/bin/python3 /vol3/agis/zhoushaoqun_group/wangyantao/GO/unipro2go.py /vol3/agis/zhoushaoqun_group/caiyanling/yft/GO/idmapping.tb.gz /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_dia_matches.sly2 /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_go.sly

~/miniconda2/envs/SolpanTP/bin/python3 /vol3/agis/zhoushaoqun_group/wangyantao/GO/unipro2go.py /vol3/agis/zhoushaoqun_group/caiyanling/yft/GO/idmapping.tb.gz /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_dia_matches.sme2 /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_go.sme

~/miniconda2/envs/SolpanTP/bin/python3 /vol3/agis/zhoushaoqun_group/wangyantao/GO/unipro2go.py /vol3/agis/zhoushaoqun_group/caiyanling/yft/GO/idmapping.tb.gz /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_dia_matches.stu2 /vol3/agis/zhoushaoqun_group/wangyantao/GO/swiss_go.stu

弄了半天,很有可能是idmapping的文件用了压缩包,应该是用解压缩之后的文件

#尝试运行,仍报错,但报错的信息发生了变化,

之前是

Traceback (most recent call last):

  File "/vol3/agis/zhoushaoqun_group/wangyantao/GO/unipro2go.py", line 28, in <module>

    UniProtKB_GO = parseIDmapping(sys.argv[1])

  File "/vol3/agis/zhoushaoqun_group/wangyantao/GO/unipro2go.py", line 15, in parseIDmapping

    if lsplit[7]:

IndexError: list index out of range

现在是

Traceback (most recent call last):

  File "/vol3/agis/zhoushaoqun_group/wangyantao/GO/unipro2go.py", line 45, in <module>

    close

NameError: name 'close' is not defined

#打开文件,/vol3/agis/zhoushaoqun_group/wangyantao/GO/unipro2go.py,将第45行的close删掉

运行成功!

最终获得gene_id + GO term 的数据集合。

接下来是需要将一对多的形式改写成一对一的形式

即:

swiss_go.stu

修改成:


swiss_go.stu1
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容