欢迎来到"bio生物信息"的世界
BMC Bioinformatics前几天发布了一个画曼哈顿图的工具Manhattan++
, 这个名字很好理解,Manhattan的升级版。
这个工具与之前画曼哈顿图的工具有什么区别呢。
最大的特点是能将显著的位点以及注释信息显示在曼哈顿图上。
可视化很漂亮,特别有高级感。
好了,以下进入主题,讲讲怎么画这个图。
1 准备需要的输入文件
需要的输入文件有三个,分别是infile, configfile, snpfile
infile的文件格式如下:
infile文件每一列所代表的内容如下:
chr - chromosome (must be numeric)
pos - position
pvalue - p-value (please do not log-transform)
maf - Minor Allele Frequency
conseq - Flag of whether variant has HIGH functional consequence (使用VEP计算)
Loci information (snpfile)的文件格式如下:
Loci information (snpfile)文件提供显著位点的Loci即可,不需要把整个基因组都放上去。
snpfile文件每一列所代表的内容如下:
markername - The name of the variant
gene - The gene name associated with the variant
chr - chromosome
pos - position
eaf - effect allele frequency
OR - Odds Ratio
Pvalue - P-value
novel - The novel flag indicates whether the loci is a new finding in the GWAS being reported.
Configuration file(configfile)文件格式如下:
configfile文件是对曼哈顿图颜色的注释,不同颜色代表不同的情况。
不同颜色所代表的信息可以看下表:
2 画图
运行命令:
安装包:
install.packages("devtools")
library(devtools)
install_github("cgrace1978/manhplot", dependencies = T, force = T)
library(manhplot)
infile<-system.file("extdata","cad.add.160614_manhformat.txt.gz",package = "manhplot")
configfile<-system.file("extdata","config.txt", package = "manhplot")
snpfile<-system.file("extdata","56cad.add.160614.variants.txt", package = "manhplot")
manhplusplot(infile = infile,outfile = "test", configfile = configfile, snpfile = snpfile)
以下是示例图:
感兴趣的请看文章:BMC Bioinformatics. 2019 Nov 27;20(1):610. doi: 10.1186/s12859-019-3201-y.Manhattan++: displaying genome-wide association summary statistics with multiple annotation layers.