zless Homo_sapiens.GRCh38.95.gtf.gz | sed -n '6,10005p' >test.gtf
R
gtf <- read.table("test.gtf",header=F,sep="\t",stringsAsFactors=F)
gtf_gene <- gtf[gtf[,3]=="gene",]
id <- NULL
name <- NULL
for (i in 1:nrow(gtf_gene)){
temp <- unlist(strsplit(gtf_gene[i,9],";"))
id[i] <- substr(temp[1],9,nchar(temp[1]))
name[i] <- substr(temp[3],11,nchar(temp[3]))
print(i)
}
id2name <- cbind(id,name)
从GFF注释文件获得Gene ID与Gene Name的对应关系列表
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- gtf注释文件中,第9列的内容并不是完全对齐的,所以用cut并不能很好的取出这三列内容。当然gene_id这列除外...
- 简介 GFF和GTF是两种最常用的基因组注释格式,在信息分析中建库时除了需要fasta文件一般还会需要这两种文件,...
- NCBI Ncbi 里包含现在最全的参考基因组数据,可以进入FTP站点查看:ftp://ftp.ncbi.nlm....