Integrative Genomics Viewer(IGV)是一个强大的基因组可视化工具,可以交互式的查看大多数的基因组相关数据,并且支持多种NGS测序数据类型。在大多数NGS数据分析中都会涉及到分析数据的可视化展示,IGV无疑为我们提供了一个便利的可视化途径。IGV不仅提供了基于Java的本地版集成工具,还可以定制化的构建web版的IGV Browser,方便地存储并展示个人的专属数据。
安装Apache服务器
首先需要下载并安装Apache服务器搭建web环境,这里以CentOS系统为基础安装apache服务器,安装完成后会生成/var/www/html
文件夹,默认开启80端口,可以通过服务器IP(http://xxx.xxx.xxx.xx)在Chrome浏览器上进行访问。
# 利用CentOS系统的包管理器yum直接安装httpd服务器
yum install -y httpd
cd /var/www/html
cat >index.html <<EOF
<html>
<head>
</head>
hello world
</html>
EOF
下载并安装igv-webapp
IGV Web App提供了一个官方的示例网站,可以通过https://igv.org/app/网址进行访问。
igv-webapp的网站源代码可以在GitHub上进行下载安装。
cd /var/www/html
git clone https://github.com/igvteam/igv-webapp
cd igv-webapp/
# 新建data和log文件夹,用于存放基因组数据和web访问日志文件
mkdir data log
# 创建web配置文件igv.conf,开放1220端口,ServerName设置为自己服务器的IP
cat >igv.conf <<EOF
Listen 1220
<VirtualHost *:1220>
ServerName xxx.xxx.xxx.xx
ServerAdmin 1369852697@qq.com
ProxyRequests Off
<Proxy *>
Order deny,allow
Allow from all
</Proxy>
DocumentRoot /var/www/html/igv-webapp
ErrorLog /var/www/html/igv-webapp/log/igv.error.log
LogLevel info
CustomLog /var/www/html/igv-webapp/log/igv.access.log combined
</VirtualHost>
EOF
# 将igv.conf文件放置到/etc/httpd/conf.d/文件夹中
mv igv.conf /etc/httpd/conf.d/
安装完成后在Chrome浏览器中输入服务器IP地址和端口http://xxx.xxx.xxx.xx:1220,即可成功访问自己的IGV Web browser,默认IGV browser提供了多个物种的基因组数据信息。
IGV browser默认提供的hg19的参考基因组信息,可以通过igvwebConfig.js
配置文件进行更改
配置个人专属基因组数据
IGV browser的基因组数据是通过resources文件下的genomes.json
文件进行读入访问的,可视化的track数据信息存放在resources文件下的tracks文件夹中,通过trackRegistry.json
文件进行读入访问,默认会从中读取数据展示,访问数据的加载速度可能会比较慢。
查看genomes.json文件
查看trackRegistry.json文件
下载并存放个人的基因组数据到data文件中,更改resources文件中的
genomes.json
文件
cd /var/www/html/igv-webapp/data
# 创建个人参考基因组文件夹
mkdir hg19 && cd hg19
# 下载参考基因组相关文件
wget https://s3.amazonaws.com/igv.broadinstitute.org/genomes/seq/hg19/hg19.fasta
wget https://s3.amazonaws.com/igv.broadinstitute.org/genomes/seq/hg19/hg19.fasta.fai
wget https://s3.amazonaws.com/igv.broadinstitute.org/genomes/seq/hg19/cytoBand.txt
wget https://s3.amazonaws.com/igv.org.genomes/hg19/refGene.sorted.txt.gz
wget https://s3.amazonaws.com/igv.org.genomes/hg19/refGene.sorted.txt.gz.tbi
# 更改genomes.json文件
cd ../../resources
vim genomes.json
将URL后的地址改为自己的服务器IP端口和数据存放的地址
同样的,track的相关信息(如bam、bed,vcf和gtf等文件)也可以存放在data文件夹中,添加或更改tracks文件夹下对应的json文件。除了在服务器中存放相关的数据,IGV browser还可以直接从本地,远端服务器或链接地址导入相关数据进行可视化展示。