karyoploteR: 将基因组信息在染色体上“画”出来

想到一个单词，karyotype: 核型; 染色体组型.
基因组浏览器（ucsc genome browser, igv这类）可以交互式地展示基因组数据的可视化结果，染色体的区段信息等等。

有时我们也需要根据自己的数据画一个这类的图，该怎么办呢？这两天就遇到这个问题了。组里面的一位前辈让我根据一些CNV的位置信息，画出它们在染色体上面的示意图。如下：

起初想了下circos图似乎也能表示，比如某个区域一个样本缺失记为1，两个样本缺失记为2......最后画柱状图的圈。但想想又不太合适，因为没人会在circos图里面只画一两个圈，太少了，而且一个圈画24条染色体太紧凑，CNV的位置看不清楚。所以最后还是决定染色体全都铺开展示。找了很久才找到这个R包——karyoploteR，还比较新，是17年发的文章，相关的教程也很少（只找到一两篇）。今天只用到了这个包里面的几个小功能，下面开始介绍。

1. 安装

这是我第一次用Bioconductor上的R包，所以先简单看了一下安装Bioconductor上R包的方法。我知道的是这么几种：install.packages()、source()+biocLite()、BiocManager::install()。
R语言 Bioconductor包的安装指南
 不用biocLite安装Bioconductor包——Y叔叔 biobabble
再结合官网说明，安装问题就解决了: http://bioconductor.org/packages/release/bioc/html/karyoploteR.html
（library(karyoploteR)的时候，可能会显示没有某些包，补上就好了）

2. 使用

快速入门: http://bioconductor.org/packages/release/bioc/vignettes/karyoploteR/inst/doc/karyoploteR.html
详细手册: http://bioconductor.org/packages/release/bioc/manuals/karyoploteR/man/karyoploteR.pdf

thus can be used to plot genomic data coming from anywhere. The only exception to this are the ideograms cytobands, that by default are plotted using predownloaded data from UCSC.
可用于绘制来自任何地方的基因组数据。唯一的例外是染色体G显带信息，默认情况下使用来自UCSC预先下载的数据绘制。

2.1 kpPlotRegions

这个绘图函数刚好可以用来画我需要的图，即CNV的位置信息。
举个例子：

gains <- toGRanges(data.frame(chr=c("chr17"), start=c(4000000),end=c(80000000)))
losses <- toGRanges(data.frame(chr=c("chr3"), start=c(80000000),end=c(170000000)))
kp <- plotKaryotype(genome="hg19")
kpPlotRegions(kp, gains, col="#FFAACC")
kpPlotRegions(kp, losses, col="#CCFFAA")

data.frame(): 创建一个数据框;
toGRanges(): 将接收到的表示染色体位置的“表格”转换为R能识别的格式——GRanges;
用法: toGRanges(A, ..., genome=NULL), A可以是（一个或几个）数据框, BED格式的文件, GRanges对象;
GRanges: 存放基因组位置和相关注释的向量。向量中的每个元素由序列名称，区间，链和可选数据列（例如score，GC含量等）组成。
plotKaryotype(): 创建一个只含有染色体核型和染色体名称的图（最原始的图）;
用法:

plotKaryotype(genome="hg19", plot.type=1, chromosomes=c("chr1","chr2"));
genome可以是UCSC中认可的基因组名称，比如hg19, mm10等等，也可以是GRanges对象;
plot.type有1...7可以选，默认是1，具体含义如下:

plot.type=1 所有染色体依次水平铺开，每个染色体上面有一个画图面板；

plot.type=2 所有染色体依次水平铺开，每个染色体上下各有一个画图面板；

plot.type=3 所有染色体在一条水平线上铺开，每个染色体上下各有一个画图面板；
......

其它的几个也好理解，但只能水平画染色体算不算一个小缺点呢？

chromosomes=c()选择需要展示的染色体，默认情况下全都展示;
zoom = A可以用来定义显示区间，A可以是数据框, BED格式的文件, GRanges对象，但只有第一个区间会被使用;
cytobands=A可以用来画自定义的染色体条带（涉及到细胞遗传学的概念），A可以是GRanges对象，数据框, BED。不过表示条带的这一列必须以 "gieStain"命名，值为gneg ，gpos25 ，gpos50，gpos75，gpos100，acen(#red, centromere)，stalk(#indented region, region with repeats)，gvar等。在查找这一部分内容时，意外发现MATLAB可以画染色体色带图，学过数学建模的小伙伴可以了解一下：https://www.mathworks.com/help/bioinfo/ref/chromosomeplot.html
main=""可以定义一个图片名称;

以上就是plotKaryotype()的用法。再来看看kpPlotRegions()。
kpPlotRegions(): 根据GRanges对象提供的位置信息，在染色体上画矩形。
用法：

kpPlotRegions(karyoplot, data, data.panel=1, r0=NULL, r1=NULL, col="black", border=NULL, avoid.overlapping=TRUE, num.layers=NULL, layer.margin=0.05);
karyoplot: plotKaryotype()的返回值，也就是只含有染色体核型和染色体名称的图；
data=A表示区间，GRanges对象，数据框, BED都行；
data.panel=1表示在染色体的上面板画，2表示在染色体的下面板画，具体取值要结合plotKaryotype()函数中的plot.type参数来选择；
r0, r1表示针对这一行画图命令，利用面板（范围是0-1）的哪一部分，比如r0=0, r1=0.5就是只利用一半面板来画图；
col, border表示填充颜色和边界颜色；
avoid.overlapping为真，若区间有重叠则堆叠起来，为假若区间有重叠则取并集只显示一个矩形，默认为真；
num.layers表示将一个大面板（panel）划分为几个小面板（layers）来画矩形，默认为NULL，会根据最大重叠次数来自动划分panel；
layer.margin小面板之间的间隔；

2.2 实战

这一个绘图函数应该讲得比较清楚了，下面来应用一下。

现编了两组数据

dels <- read.table("del.txt",header = T)
dups <- read.table("dup.txt",header = T)
gains <- toGRanges(dups)
losses <- toGRanges(dels)
my_kp <- plotKaryotype(genome="hg19",plot.type = 2, chromosomes=c("chr1","chr2"),main="my test")
kpPlotRegions(my_kp, gains, col="blue",border = "white",r0 = 0, r1 = 1,num.layers = 5)
kpPlotRegions(my_kp, losses, col="red",border = "white",data.panel = 2)

到这儿这一部分就结束了，这个R包的其他绘图函数下次再讲。
另外，看完这些可能会有一个疑问，其他的一些物种可以画吗？按照官方的说明，在UCSC上能找到的应该都能画。不过，一些植物物种应该就只能根据自己的数据绘制核型图了。

最后编辑于：2018.12.25 15:16:28

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,293评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,604评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,958评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,729评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,719评论 5赞 366
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,630评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,000评论 3赞 397
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,665评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,909评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,646评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,726评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,400评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,986评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,959评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,197评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 44,996评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,481评论 2赞 342

karyoploteR: 将基因组信息在染色体上“画”出来

1. 安装

2. 使用

2.1 kpPlotRegions

2.2 实战

推荐阅读更多精彩内容