我的ChIP-Seq(4):MAnorm差异分析

哈哈,搜了一圈没发现网上有关于MAnorm的中文教程或者是说明,本文将是第一篇~撒花✿✿ヽ(°▽°)ノ✿那就要用心写了,感到鸭梨.jpg==

首先,MAnorm是什么,可以做什么呢?
简单地说,这是一款寻找两个ChIP-Seq样本之间差异peak的软件。一般ChIP的流程中,若是单一处理的细胞系,那么callpeak之后可能会做binding motif的分析或是peak相关gene的功能分析等;但若是两种处理的细胞系(比如饥饿组和对照组),我们肯定想要知道两种处理下,组蛋白修饰的差异,类似于RNA-Seq中差异表达基因的分析,所以这时就需要进行差异分析。MAnorm就可以实现这样的分析需要。

一般来说,上述差异分析不一定要在peaks水平进行,完全可以在reads水平,这个就叫做“一步法”;而通过先分别callpeak再比较peaks的density或者depth等,就是所谓的“两步法”。不同方法有不同类型的软件可供选择,这就是ChIP分析成熟的地方,不过技术流大可根据自己的目的写脚本进行个性化处理,这个暂且不表。

那么差异分析软件如何选择呢?根据组蛋白修饰类型、样品是否有重复、是否需要callpeak(即predefined region set),下图一目了然:


Steinhauser et al.2016

我的样品有宽峰窄峰两种修饰、无重复,项目时间紧张尽量想用一个软件实现,所以选择了MAnorm。

MAnorm的原理

话不多说,直接看图:

Shao et al. Genome Biology 2012

概括的说,通过比较两个样品的common peak的density差异,标准化unique peaks,也就是说,既然两个样本间common peak强度一致,那么peak内的reads差异倍数就是测序深度/密度的差异,能够作为normalization的标准。直接比较标准化后的peaks,避免了不同样品信噪比不同的问题。
这个算法基于这样的假设:两个样本间都有的 peak 或是 banding 位点,相关蛋白的结合机制相同,故应有相同的 binding intensity。

MAnorm的使用

1.安装

1.1.4版本
conda/PyPi
需要注意的是,此版本只支持bed格式且不支持paired-end模式,会把所有reads当成single-end处理。若reads文件想用支持更多的格式(sam/bam/bedpe等),请用v1.2.0。
1.2.0版本
暂时只能从Github复制源码进行安装。方法:

git clone https://github.com/shao-lab/MAnorm.git
unzip MAnorm-1.2.0.zip
cd MAnorm
pip install .     ###注意.不要漏掉!
manorm --version ##检查一下是否安装成功,成功后将程序软链接至我的bin或添加至环境变量
2.数据准备

建议首先阅读使用说明,最好从linux中manorm --help,或者在Github中找到相应版本的附带说明,这一点很重要,因为有时网上搜到的说明和你实际用的版本不一致,会走弯路,不要问我咋知道的。
所以要准备的文件有4个:

sample1_peaks.bed/sample2_peaks.bed:
默认bed,支持MACS2出来的结果peaks.xls,软件自动识别无需调整。
sample1_reads.bed/sample2_reads.bed:
默认bed,v1.2.0开始支持其他格式(sam/bam),需使用参数 -rf

将如上文件移动至新文件夹下待用。***tips:这里不再需要对照组In的文件了

3.运行

基本命令(--p1 --p2 --r1 --r2 -o是5个必需参数,注意是两个-):

manorm
--p1 sample1_peaks.xls 
--p2 sample2_peaks.xls 
--pf macs  #指定peaks form
--r1 sample1_reads.sam 
--r2 sample2_reads.sam 
--rf sam #指定reads form
--pe  #paired-end模式
-o output_dir #指定输出文件路径

建议试运行一组数据先,根据报错文件调整格式。软件还不太成熟,需要多调整格式。

4.结果

运行约10min,产生4个结果文件:
sample1peaks_vs_sample2peaks_all_MAvalues.xls:这个是主要的结果文件,Excel格式,里面的peak_group有标注是common/1unique/2unique的。
output_figures 文件夹:4个图,计算的Mvalue Avalue(MA)及校正之后的MA,大概就是这个意思,还需要读文献琢磨
output_filters 文件夹:3个peaks.bed文件,可能就是条件严格了点之后的结果,两个biased包括的peaks很少,一个unbiased包括的peaks很多跟all那个文件差不了多少。
output_tracks 文件夹:3个wig文件,是M A values的,UCSC可视的文件类型。

综上,决定用main output file即第一个结果,进行后面的分析。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,937评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,503评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,712评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,668评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,677评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,601评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,975评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,637评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,881评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,621评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,710评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,387评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,971评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,947评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,189评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,805评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,449评论 2 342

推荐阅读更多精彩内容

  • 在实战之前,首先对CHIP-seq分析做一些了解,以下是从各个地方copy过来综合起来的,有些散乱,是我认为重要以...
    生信start_site阅读 10,692评论 0 59
  • 理解ChIP-Seq 到了目前这个水平,我学习新的高通量数据分析流程时已经不再考虑代码应该如何写的问题了。我更多要...
    xuzhougeng阅读 66,396评论 11 152
  • 1. 学习目标 讨论ChIP-seq数据质量评估的其他方法 用ChIPQC产生质量统计报告 鉴定低质量数据的来源概...
    六六_ryx阅读 15,363评论 0 17
  • 感恩日记(251) 《伤疤》 树欲挺拔, 剪枝去桠, 每个伤痛之处, 长出坚硬节花。 月季剔杈, 重绽鲜花。 果树...
    hao黑土阅读 77评论 0 1
  • 对不起、谢谢你、请原谅、我爱你。清理、清理、不断的清理。 由于昨天没有写回向,承诺接下来的三天都要写下自己的感恩和...
    抒砾阅读 265评论 0 0