2020-12-17水稻、小麦GO富集分析

RNAseq常规做法是先筛选出差异表达基因,然后针对筛选出来的差异基因做GO富集分析。

1.水稻、小麦GO信息提取

在进行GO富集分析前首先要确定在你所使用的GO富集分析软件(包)中你所研究的物种有没有相应Gene与GO对应关系。如果没有,则需要自己根据该物种功能注释文件去提取Gene与GO对应关系。当然如果你对一些新组装出来的基因感兴趣,也可以通过跑blast2go等电子注释方法获取Gene对应GO信息。

## 方法一:从功能注释文件中提取。
##1.水稻(wget下载):wget https://rapdb.dna.affrc.go.jp/download/archive/irgsp1/IRGSP-1.0_representative_annotation_2020-12-02.tsv.gz
setwd("/Users/mac/Desktop/项目/rice")
library(tidyr)
library(stringr)
#Note:提取注释文件中的GO-GENE
Func_Anno<-read.table("IRGSP-1.0_representative_annotation_2020-12-02.tsv",sep="\t",quote = "",header=TRUE,fill=TRUE)
GO_Gene<-Func_Anno[,c(2,10)]
  #去掉空值行(基因对应GO id为空)
GO_Gene<-GO_Gene[-which(GO_Gene$GO==""),]
  #拆分第二列数据(Note:一个逗号一个GO)
GO_Sep<-separate(GO_Gene,col=GO,sep =',',remove = TRUE,into=as.character(c(1:50)))
    #检查GO是否完全分开
which(!is.na(GO_Sep[,51]))         #判断最后一列是否有非NA值
sum(is.na(GO_Sep[,51]))            #判断最后一列为NA值行数是否与矩阵行一样
    #删除全为NA的列
GO_Sep<-GO_Sep[,-which(apply(GO_Sep,2,function(x) all(is.na(x))))]
  #按行合并
GO_Gene_Matr<-data.frame(matrix(NA,300000,2))
for(i in 2:ncol(GO_Sep)){
  if(i==2){
    tmp<-as.matrix(GO_Sep[,c(1,i)])
    GO_Gene_Matr<-tmp
  }else{
    tmp<-as.matrix(GO_Sep[,c(1,i)])
    GO_Gene_Matr<-rbind(GO_Gene_Matr,tmp)
  }
}
  #取出含GO的行
GO_Gene_Matr<-GO_Gene_Matr[grep("GO:",GO_Gene_Matr[,2]),]
GO<-data.frame(str_sub(GO_Gene_Matr[,2],start=-11L,end=-2L))
GO_Gene_Matr_Final<-cbind(GO_Gene_Matr,GO)
GO_Gene_Matr_Final<-GO_Gene_Matr_Final[,c(1,3)]
GO_Gene_Matr_Final<-unique(GO_Gene_Matr_Final)
colnames(GO_Gene_Matr_Final)<-c("GeneID","GO")
write.table(GO_Gene_Matr_Final,"GO_Gene.txt",col.names = TRUE,row.names = FALSE,quote=FALSE,sep="\t")

##2.小麦(wget下载):wget https://urgi.versailles.inra.fr/download/iwgsc/IWGSC_RefSeq_Annotations/v1.0/iwgsc_refseqv1.0_FunctionalAnnotation_v1.zip
Note:解压后使用里面的iwgsc_refseqv1.0_FunctionalAnnotation_v1__HCgenes_v1.0.TAB(高可信任基因)
setwd("/Users/mac/Desktop/项目/triticum_aestivum/GO")
library(tidyr)
library(stringr)
#1.提取注释文件中的GO-GENE-Function
Func_Anno<-read.table("iwgsc_refseqv1.0_FunctionalAnnotation_v1__HCgenes_v1.0.TAB",sep="\t",quote = "",header=TRUE)
GO_Gene<-Func_Anno[,c(1,8)]
  #去掉空值行(基因对应GO id为空)
GO_Gene<-GO_Gene[-which(GO_Gene$GO.IDs..Description..via.Interpro==""),]
GeneID<-sub('..$','',GO_Gene[,1])
GO_Gene$Gene.ID<-GeneID
  #拆分第二列数据
GO_Sep<-separate(GO_Gene,col=GO.IDs..Description..via.Interpro,sep =';',remove = TRUE,into=as.character(c(1:20)))
  #检查GO是否完全分开(没有增加前面的into范围)
which(!is.na(GO_Sep[,21]))         #判断最后一列是否有非NA值
sum(is.na(GO_Sep[,21]))            #判断最后一列为NA值行数是否与矩阵行一样
GO_Sep_Matr<-data.frame(matrix(NA,300000,2))
k=1
for(i in 1:nrow(GO_Sep)){
  for(j in 2:ncol(GO_Sep)){
    if(is.na(GO_Sep[i,j])==FALSE){
      GO_Sep_Matr[k,1]<-GO_Sep[i,1]
      GO_Sep_Matr[k,2]<-GO_Sep[i,j]
      k=k+1
    }
  }
}
GO_Sep_Matr<-GO_Sep_Matr[-which(apply(GO_Sep_Matr,1,function(x) all(is.na(x)))),]
Extract<-str_split_fixed(GO_Sep_Matr[,2]," ",n=2)
GO_Info<-cbind(GO_Sep_Matr[,1],Extract[,1:2])
  #去重复
GO_Info<-unique(GO_Info)
colnames(GO_Info)<-c("GeneID","GO","Function")
GO_Gene<-GO_Info[,1:2]
write.table(GO_Gene,"GO_Gene.txt",col.names = TRUE,row.names = FALSE,quote=FALSE,sep="\t")
write.table(GO_Info,"GO_Info.txt",col.names = TRUE,row.names = FALSE,quote=FALSE,sep="\t")
#方法二:从一些数据库中下载背景文件,然后分析。
http://systemsbiology.cau.edu.cn/agriGOv2/download.php

2.GO富集分析

Note:参考TBtools完成。

2.1富集分析

TBtools使用说明

2.2可视化

TBtools使用说明
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,980评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,422评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,130评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,553评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,408评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,326评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,720评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,373评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,678评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,722评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,486评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,335评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,738评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,283评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,692评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,893评论 2 335

推荐阅读更多精彩内容