还记得生信技能树的传送门系列吗?转录组、甲基化、ChIP-Seq、lncRNA、编程实战、还有已经在更新中的Hi-C......几乎大家关心的数据分析都可以在大树里找到入门和进阶教程。最近看到小伙伴们很希望看到完整的ATAC-Seq分析教程,甚至在某群里呼吁众筹。虽然说所有的NGS数据分析都有类似的道理,ATAC-Seq和ChIP-Seq更是具有相似的分析方法,但是小伙伴们在实战中可能仍然有困惑:
- ATAC-Seq与ChIP-Seq的异同在哪里?
- 用和ChIP-Seq一样的参数Call peaks正确吗?
- 得到peaks后怎么进行质量评估?
- 样本内的重复怎么处理?
- 样本间的差异怎么分析?
- 怎么对peaks进行功能注释分析?
- 如何找motif?
- ATAC-Seq和ChIP-Seq和RNA-Seq的整合分析怎么做?
以上一些困惑也是我在学习ATAC-Seq分析时遇到的问题,期间自己查资料、参加相关讲座和培训,这些困惑逐渐被揭开,就开始整理这些资料,资料整理的时候发现了一处宝藏——Harvard Chan Bioinformatics Core (HBC)的深度NGS数据分析课程,该课程的第5部分是关于ChIP-Seq,仔细看了一下内容,非常赞,整体思路和绝大部分分析方法都适合ATAC-seq。而这个课程生信技能树里是推荐过的彻底入门生物信息学,可能需要12天!,不知道有多少人看过这个课程?当时有很多人反映打不开相关链接,可能也有一部分人觉得英文看着不方便或是一个人学着没劲头。
这里就再次推荐这个课程,并以该课程的翻译为主,同时加上ATAC-Seq分析与ChIP-Seq的异同以及ATAC-Seq分析的一些心得,与大家一起学习并打造ATAC-Seq的入门和高阶传送门。
ATAC-Seq/ChIP-Seq整个分析的流程图:
接下来要更新的内容:
- 第1篇:ATAC-seq的背景介绍以及与ChIP-Seq的异同
- 第2篇:原始数据的质控、比对和过滤
- 第3篇:用MACS2软件call peaks
- 第4篇:对ATAC-Seq/ChIP-seq的质量评估(一)——phantompeakqualtools
- 第5篇:对ATAC-Seq/ChIP-seq的质量评估(二)——ChIPQC
- 第6篇:重复样本的处理——IDR
- 第7篇:用Y叔的ChIPseeker做功能注释
- 第8篇:用网页版工具进行motif分析
- 第9篇:差异peaks分析——DiffBind
- 第10篇:ATAC-Seq、ChIP-Seq、RNA-Seq整合分析
- 额外篇:文献推荐和解读
参考资料:
HBC深度NGS数据分析课程:
https://github.com/hbctraining/In-depth-NGS-Data-Analysis-Course
第五部分ChIP-Seq课程:
https://github.com/hbctraining/In-depth-NGS-Data-Analysis-Course/tree/master/sessionV/lessons