准备参考基因组hg19及其基因的注释文件
可以在UCSC网站的官网上下载hg19参考基因组的序列和基因注释文件使用JBrowser自带的脚本导入参考基因组序列
cd /var/www/html/JBrowse-1.16.4/
mkdir data && cd data #新建一个data文件夹用于存放不同的基因组
mkdir hg19 && cd hg19 #新建hg19文件夹用于存放hg19参考基因组
# 使用gffread将gtf格式基因注释文件转换为gff3格式文件
/data/public/software/cufflinks-2.2.1/gffread hg19.gencode.v14.annotation.gtf -o- < hg19.gencode.v14.annotation.gff3
# 使用脚本prepare-refseqs.pl导入hg19参考基因组
../../bin/prepare-refseqs.pl --fasta hg19.fa --out ./
导入参考基因组后,会在当前文件夹中生成一个seq
文件夹和trackList.json
及tracks.conf
两个配置文件。
使用JBrowser自带的脚本导入基因注释信息
目前JBrowser对基因的注释信息提供了两种feature的展示形式:HTMLfeatures
和CanvasFeatures
。其中HTMLfeatures暂时只支持gff3格式文件,而CanvasFeatures可以同时支持gtf和gff3格式,但是它是临时读取文件的,在browser中显示的速度会比较慢。
- HTMLfeatures导入
# 查看使用说明信息
../../bin/flatfile-to-json.pl -h
Usage:
flatfile-to-json.pl \
( --gff <GFF3 file> | --bed <BED file> | --gbk <GenBank file> ) \
--trackLabel <track identifier> \
[ --trackType <JS Class> ] \
[ --out <output directory> ] \
[ --key <human-readable track name> ] \
[ --className <CSS class name for displaying features> ] \
[ --urltemplate "http://example.com/idlookup?id={id}" ] \
[ --arrowheadClass <CSS class> ] \
[ --noSubfeatures ] \
[ --subfeatureClasses '{ JSON-format subfeature class map }' ] \
[ --clientConfig '{ JSON-format style configuration for this track }' ] \
[ --config '{ JSON-format extra configuration for this track }' ] \
[ --thinType <BAM -thin_type> ] \
[ --thicktype <BAM -thick_type>] \
[ --type <feature types to process> ] \
[ --nclChunk <chunk size for generated NCLs> ] \
[ --compress ] \
[ --sortMem <memory in bytes to use for sorting> ] \
[ --maxLookback <maximum number of features to buffer in gff3 files> ] \
[ --nameAttributes "name,alias,id" ] \
# 使用flatfile-to-json.pl脚本导入基因注释信息
../../bin/flatfile-to-json.pl --gff hg19.gencode.v14.annotation.gff3 --type mRNA --trackLabel GeneAnnot --key 'GFF3-mRNA-HTMLfeatures' --className transcript --getSubfeatures --subfeatureClasses '{"CDS": "transcript-CDS"}' --arrowheadClass arrowhead --autocomplete all --metadata '{"category" : "GeneAnnotation"}' --out ./
导入基因的注释信息后,会在当前文件夹下生成一个tracks
文件夹,并将相应基因注释的配置信息写入到trackList.json
配置文件中。
- CanvasFeatures导入
编辑生成的tracks.conf
文件,直接在里面添加相应基因注释的配置信息
(1) 导入gff3文件
在./tracks.conf文件中添加以下配置信息:
[ tracks . hg19-GFF3 ]
storeClass = JBrowse/Store/SeqFeature/GFF3
urlTemplate = ./hg19.gencode.v14.annotation.gff3
type = CanvasFeatures
category = Gene
key = GFF3-hg19-CanvasFeatures
(2) 导入gtf文件
在./tracks.conf文件中加入以下配置信息:
[ tracks . hg19-GTF]
storeClass = JBrowse/Store/SeqFeature/GTF
urlTemplate = ./hg19.gencode.v14.annotation.gtf
type = CanvasFeatures
category = Gene
key = GTF-hg19-CanvasFeatures
style.label = transcript_id,gene_id
在浏览器中展示hg19参考基因组及其基因注释信息
打开google浏览器,在里面直接输入服务器对应的ip地址和文件路径即可查看相应基因组的相关信息
http://xxx.xxx.xxx.xx/JBrowse-1.16.4/index.html?data=data/hg19/