HI-C 数据分析pipeline(三:AB compartment 区室计算)

使用HicPro处理fastq data,并进行了数据格式转换以后,就可以进行一些常规的HiC下游计算了,最常规的包括AB compartment,TAD相关计算,loop相关计算。本文整理了我自己使用的AB区室计算的相关方法和代码。

一、HiC ValidPair修饰

hicpro 软件输出的validPair文件,经过简单修饰后,再使用homer进行compartment计算PC1值,PC1>0的区域为A区室,PC1<0为B区室。

homer软件只需要validPair的前7列:

cat CT.allValidPairs |awk 'BEGIN{FS=OFS="\t"}{print $1,$2,$3,$4,$5,$6,$7}' > CT.allValidPairs.homer

二、call PC1 value —— homer

## step 1 : makeTagDir
tagdir=~/data/hic/homer/tagDir
makeTagDirectory ${tagdir}/CT -format HiCsummary CT.allValidPairs.homer
## step 2 : calculate PC1 value
## 如果有ATAC 测序数据,则ATAC narrowPeak文件可以作为 seed 输入,辅助计算PC1
mm10=~/data/database/Mus_musculus.GRCm38.dna.toplevel.fa
seed=~/data/hic/homer/seed_active/
output=~/data/hic/homer/compartment/
runHiCpca.pl ${output}-500k ${tagdir}/CT -cpu 20 -res 500000  -genome $mm10 -pc 1 -active ${seed}/CT.narrowPeak
## output data,两个output
head -n 5 CT-500k.PC1.bedGraph
track name="..."  yLineMark="0.0" alwaysZero=on maxHeightPixels=100:75:11 visibility=full viewLimits=-1:1 autoScale=on type=bedGraph
chr11   3080000 3120000 -0.220452952221998
chr11   3120000 3160000 -0.200718202287763
chr11   3160000 3200000 0.0416765017206624
chr11   3200000 3240000 0.343580286630125
[medhdl@login2 compartment]$ head -n 5 CT-500k.PC1.txt
#peakID chr     start   end     strand  PC1
chr11-3080000   chr11   3080000 3120000 +       -0.510452952221998
chr11-3120000   chr11   3120000 3160000 +       -0.314718202287763
chr11-3160000   chr11   3160000 3200000 +       0.0806765017206624
chr11-3200000   chr11   3200000 3240000 +       0.894380286630125

以上运行所得的矩阵可以导入R中进行相关下游分析,非常方便。

三、使用PC1 value 进行后续分析

变成文本了以后,用R进行统计就可以。

1、标记 AB compartment

通过PC1的正负符号标记 AB compartment。

#为了方便理解,这里尽量了使用最简单的Rcode
pc1.ct <- read.table("CT-500k.PC1.txt") #读入计算所得的PC1矩阵
colnames(pc1.ct) <- c("peakID","chr","start","end","strand","PC1")
pc1.A <- read.table("A-500k.PC1.txt") #读入计算所得的PC1矩阵
colnames(pc1.A) <- c("peakID","chr","start","end","strand","PC1")
pc1.dat <- merge(pc1.ct,pc1.A,by=c("peakID","chr","start","end","strand"))
colnames(pc1.dat)[6:7] <- c("CT","A") #合并矩阵
pc1.dat$ABtrans <- ifelse(pc1.dat$CT < 0 & pc1.dat$A < 0,"BB",
                              ifelse(pc1.dat$CT > 0 & pc1.dat$A > 0,"AA",
                                     ifelse(pc1.dat$CT < 0 & pc1.dat$A > 0,"BA","AB"))) #标记区室信息

2、计算区室转换的比例

统计AB区室转换的数量和比例。


pc1.trans <- pc1.dat %>% group_by(ABtrans) %>%
  summarise(n=n()) %>% as.data.frame() #计算四类区室转换的染色质区域个数
pc1.trans$percentage <- round(x=(pc1.trans$n)/sum(pc1.trans$n),digits = 2) #计算四类区室转换的占比
pc1.trans$label <- paste0(pc1.trans$ABtrans,"(",pc1.trans$percentage,"%)") #设置画图标记

3、画图

使用ggplot2包简单画个饼图,存成svg格式,再在PPT中修改格式细节。


p <- pc1.transW7vsM25.pctrans %>% 
  ggplot(aes(x="",y=percentage,fill=ABtrans))+
  geom_bar(stat="identity")+
  coord_polar(theta = "y")+
  labs(title = "ABtrans_portion")+
  scale_fill_manual(values = brewer.pal(9,"Blues")[c(2,4,5,3)],labels=pc1.trans$label)+
  theme_bw(base_line_size = NA)+
  theme(axis.text = element_text(size = 12,color="black"),legend.position = "top")
svg(file="ABtrans.svg",height=8,width=8) #保存svg格式,方便在window上进行修改
p
dev.off()

svg格式的图片灵活性还是蛮高的,可以根据需求随便改【只要不改数据】,一个简单的效果图:


图1.png

也可以画成类似文献中的bar图,这个就看大家的喜好啦,比如:

图2.png

图片来源发表文献

区室分析内容差不多就这些,一些其他的联合分析,还需要视具体情况而定。例如可以在IGV或WashU上进行Track观察,联合ATAC-seq和RNA-seq数据观察区室转换与基因表达调控的联系等。

下篇继续总结TAD相关的分析。

公众号原文: HI-C 数据分析pipeline(三:AB compartment 区室计算)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335

推荐阅读更多精彩内容