GPL平台注释,如何从gene_assinment中挖出gene symbol
https://www.bioinfo.info/?/question/6112
在做芯片分析时,得到了差异基因的list,但是读入GPL6244的注释文件发现gene symbol不是单独的一列,而是隐藏在gene_assignment这一列中间。怎么才能注释得到gene symbol结果?
回复1:这个你可以把 gene_assignment这一列取出来,然后使用 // 分割, 取分割以后的第1列即可。R里面limma包有个函数好像叫 strsplit2() ,你可以试试。
回复2:
library(tidyverse)
symbol<-str_split_fixed(annotation_file$gene_assignment,pattern = "//",3)[,2]