这篇文献阅读笔记比较长,属于CUT&RUN比较早的一篇综述了。是2017年发表在eLife上的。这篇文章通过把CUT&RUN与ChIP等方法从各个方面进行了比较,详细的说明了CUT&RUN的优点。因为之前仅仅是听说有这么一个技术,从来也没有深入的了解它,所以这篇笔记的主要目的就是进一步的了解CUT&RUN的一些特点和应用。(有些地方翻译的比较晦涩,如果真的想仔细了解还需看原文体会)
题目是:An efficient targeted nuclease strategy for high-resolution mapping of DNA binding sites
摘要
本篇文章,我们主要描述CUT&RUN(Cleavage Under Targets and Release Using Nuclease),这是一种染色质谱分析策略,它是抗体靶向的、由微球菌核酸酶控制切割特异的蛋白质-DNA复合体,并释放到上清中,之后进行为paired-end 测序。不同于ChIP(CHIP需要将染色体片段化,并溶解所有的染色质),CUT&RUN是在原位进行操作的,允许定量的高分辨率染色质比对,以及探测局部染色质环境。当把CUT&RUN应用于酵母和人类细胞核时,可以生成精确的转录因子谱,同时避免交联和溶解的问题。CUT&RUN操作起来很简单,背景非常低,只需要1/10的CHIP测序深度,使CUT&RUN特别高效的绘制转录因子和染色质谱分析。应用于human CTCF时, CUT&RUN绘制了高分辨率的定向远距离位点。我们认为,CUT&RUN的蛋白-DNA相互作用的原位比对是一种新的方法,有代替ChIP-seq的潜力。
前言
转录因子(TFs)在其结合位点上的作用是驱动基因表达,因此全基因组转录因子mapping已成为研究人员的中心目标。TF谱分析最常用的是ChIP,一种自30多年前首次引入以来几乎没有改变的方案(Solomon and Varshavsky, 1985)。细胞用甲醛交联,染色质被片段化,溶解后,加入抗体,抗体结合的染色质被恢复,之后提取DNA。DNA图谱技术的连续进步已经彻底改变了X-ChIP(甲醛交联芯片)的使用,并且有了ChIP-seq,使得TFs的碱基对分辨率图谱变得可行(Rhee and Pugh, 2011; Skene and Henikoff, 2015; He et al., 2015)。对ChIP-seq的改进保留了交联步骤,以保持体内模式,而整个基因组被片段化,以便创造一个可溶解的提取物,用于免疫沉淀。但是,交联可以促进表位掩蔽(masking),产生假阳性结合位点(Teytelman et al., 2013;Park et al., 2013; Jain et al., 2015; Baranello et al., 2016; Meyer and Liu, 2014)。使用不破坏静电接触的离子条件,ChIP也可以在不交联的情况下完成(Kasinathan et al., 2014)。“Native”ChIP提供了一种蛋白质- DNA直接相互作用的图谱,在灵敏度和特异性上进行权衡,与X-ChIP方法相比更受欢迎。Native ChIP还将表位掩蔽问题最小化,并相对于X-ChIP提高了效率,使其更适合较低的起始细胞数(O’Neill et al., 2006;Brind’Amour et al., 2015)。但是蛋白质-DNA复合物不完全的提取效率和潜在的结合损失这些问题仍然存在。
ChIP中系统偏差和人为引起的不确定性,强调了需要基于不同原理方法的必要性。一类重要的非ChIP mapping方法包括通过嵌合融合将酶与DNA-结合蛋白结合,以及酶在DNA附近的局部作用。例如DamID (van Steensel et al., 2001)和相关方法(Southall et al., 2013; Hass et al., 2015),大肠杆菌Dam甲基转移酶与TF结合,在体内催化腺嘌呤的GATC位点N6 -甲基化。使用N6 -甲基导向限制性内切酶可以在全基因组范围内比对位点。然而,由于DamID的分辨率受到GATC位点分布的限制,DamID无法获得通过测序read-out实现高分辨率(Aughey and Southall, 2016)。另一种酶连接的方法是,染色质内源性裂解(ChEC)将内切酶-外切酶微球菌核酸酶(MNase)连接到TF上(Schmid et al., 2004)。在ChEC中,MNase被渗透的细胞激活,并添加钙以控制裂解。我们最近将Illumina测序read-out应用于ChEC (ChEC-seq),实现了近碱基对的分辨率(Zentner et al., 2015)。酶连接(tethering)的方法与ChIP有根本的不同,因为它们是在体内(DamID)或在原位(ChEC)进行的,直接从活细胞或渗透的细胞中提取DNA,从而消除了溶解和恢复(recover)染色质的需要。
DamID和ChEC都要求为每个转录因子生成不同的嵌合融合结构,这限制了它们的通用性,例如对动物模型、患者活检和翻译后修饰。在最初的ChIC方法中,首先用TF特异性抗体处理交联的天然细胞核,然后加入蛋白A和MNase (pA-MN)的嵌合融合,并通过钙激活(Schmid et al.,2004)。蛋白A特异性地与免疫球蛋白G结合,从而消除了对融合蛋白的需要。在这里,我们报道了ChIC的一个主要发展,它保留了酶连接方法的优势,同时扩展了它的适用性和易使用性,以取代其他现有的方法。我们protocol的一个关键特点是,在没有交联的情况下,在TF两侧用钙诱导的MNase裂解几秒钟后,TF-DNA复合物被释放到溶液中,可以通过简单的离心和DNA提取恢复纯化的TF结合的DNA片段,之后进行测序。通过在磁珠上进行这一操作,我们的CUT&RUN技术比ChIP-seq更简单,同时保留了原位方法的优势。通过CUT&RUN的靶向消化,相对于ChIP的完整的基因组片段,大大的降低了背景,只需要标准ChIP方法的1/10的测序深度。简单的spike-in对照可以精确地定量蛋白质结合,这是其他方法无法做到的。此外,该方法允许较低的起始细胞数,通过在磁珠上执行反应,实现自动化是有可能的。
结果
(一)CUT&RUN的概述
染色质免疫裂解(ChIC)的优势是使用TF特异性抗体系住MNase,并只在结合位点裂解。CUT&RUN对ChIC的改进是观察到核的轻微MNase处理释放单核小体和TF-DNA复合物,留下寡核小体(Sanders, 1978; Teves and Henikoff, 2012)。TF两侧的定向裂解将把TF- DNA复合物释放到上清液中,将剩余的基因组留在沉淀的核中。通过在冰上进行简短的消化反应,我们可以在TF结合的MNase扩散到周边的基因组和裂解可接近的染色质之前在上清中恢复TF-DNA复合物。基于这个基本原理,我们开发了一个简单的CUT&RUN步骤(图1A)。未固定的核(1)栓在lectin-coated磁珠上,(2)先后与抗体和蛋白A-MNase (pA-MN)孵育,其次是简单的洗涤步骤,(3)在冰上与Ca + +混合,启动裂解反应,之后利用螯合作用停止数秒到数分钟,(4)离心包含释放的TF-DNA复合物的上层清液,从而进行恢复。然后从上清中提取DNA,直接用于测序文库的准备。
(二)CUT&RUN产生有限的染色质复合物消化
我们首先使用原始的酵母核进行CUT&RUN。为了严格比较CUT&RUN和ChIPseq,我们使用了相同的FLAG标记TF菌株、相同的细胞核制备方案、相同的小鼠anti-FLAG单克隆抗体以及相同的Illumina文库制备和paired-end测序程序(Kasinathan et al., 2014)。由于小鼠Protein A与小鼠的IgG结合很弱,我们使用rabbit anti-mouse二抗来进行CUT&RUN。
为了测试CUT&RUN的效率,我们使用了一株表达3xFLAG标记组蛋白H2A的酿酒酵母(Saccharomyces cerevisiae)菌株,该菌株在全基因组释放核小体片段。事实上,在0˚C经过100倍的消化过程后,我们观察到染色质逐渐裂解并释放寡核小体大小,完全取决于一抗的存在(图1B)。
接下来,我们将CUT&RUN应用于两种结构不同的酿酒酵母TFs,即ARS结合因子1(Abf1)和rDNA增强子结合蛋白1(Reb1),每个样本获得约2-3百万的paired-end reads。我们发现,在4s到128s之间的时间点,在~ 150bp以下,比对片段的大小分布实际上是重叠的(图1C)。时间点在32倍范围内的一致性表明:添加Ca++后,TF结合片段的限制性消化会迅速发生,这表明消化时间不是一个关键参数。
Mapped的TF片段大小在~100 bp时达到峰值,相反的,H2A片段在~150 bp时达到峰值。正如我们期望的TF复合物小于~ 100个bp以及核小体~ 150个bp。我们分别绘制<= 120 bp和>=150个bp的片段。1秒到128秒之间的没有明显差别。确认逐步释放的TF-DNA复合物产量是限制性的消化反应。总DNA的提取和小片段的纯化结果几乎相同(图1 -补充图3),说明从上清中提取DNA定量地恢复了TF结合片段。
(三)CUT&RUN以高分辨率原位绘制TF结合位点
为了验证<= 120 bp的片段代表了TF结合位点附近的裂解,我们首先确定所有显著的Abf1和Reb1的motif,发现基于CUT&RUN数据的motif和基于ORGANIC的motif几乎相同(图1-补充图4A-D)。我们使用来自ORGANIC的motif来扫描酵母基因组,这为我们提供了一个完整的1899个 Abf1的motif和1413个 Reb1的motif的列表,这些motif完全独立于CUT&RUN。我们证实了每个数据集的大多数峰都与motif重叠,Abf1的CUT&RUN的结果比ORGANIC更好。然后我们把<=120 bp和>=150 bp的profile的中心与motif进行比对,之后画热图。按occupancy排序的时候,以2 kb为中心的间隔,对于Abf1和Reb1的motif,我们观察到>90%的TF位点被片段占据(相对位于侧翼区域的相应基序上)(图2),代表其可能为真阳性。相对于核酸酶可及性,Abf1和Reb1的motif的CUT&RUN占据率显示出较高的动态范围,在热图中看到CUT&RUN有着高对比度的背景。相比之下,Abf1片段在不重叠的Reb1位点的占用率可以忽略不计,而在不重叠的Abf1位点的Reb1片段占用率则相反。TF motif的存在和TF的占位之间几乎完全一致,而对于其他的转录因子的普遍缺失,意味着CUT&RUN对于转录因子结合具有高度敏感性和特异性。
为了直接比较CUT&RUN和高分辨率的ChIP-seq,我们同样使用了“ORGANIC”ChIP-seq的Abf1和Reb1 motifs。正如之前报道的(Kasinathan等,2014),ORGANIC ChIP-seq检测到了整个基因组中绝大多数的Abf1真阳性motif和几乎所有的Reb1 motif(图2)。80 mM NaCl提取的Reb1数据最好,600 mM NaCl提取的Abf1数据最好。对于频繁假阳性的Abf1占位,,Reb1的动态范围始终优于Abf1(图2)。相比之下,CUT&RUN对两个TFs在相同的消化时间点上显示了相同的动态范围,而paired-end的Reads数却少了约10倍,这表明CUT&RUN比ORGANIC ChIP-seq更灵敏。相对于这些高分辨率方法(Kasinathan et al., 2014),使用交联和超声的标准ChIP-seq显示了较低的敏感性和特异性(图2)。因此,与ChIP-seq相比,CUT&RUN提供了更好的TF occupancy maps,提高了灵敏度/特异性。
为了评估CUT&RUN的分辨率,我们绘制了每个TF的“footprint”,作为在motif中点附近片段的平均密度。对于Abf1和Reb1,我们观察到20 bp宽的footprints,表明这些转录因子保护了以motif为中心的约20 bp,分辨率接近碱基对(图3A)。有趣的是,上游和下游在cleavage maps显示Abf1和Reb1的motif两边均呈锯齿状,在>100 bp以上,“齿”之间的距离约为10 bp,经自相关分析证实与碱基组成无关(图3B)。这种10 bp的cleavage偏好与B型DNA的10 bp/turn周期相匹配,这表明这些结合TFs两侧的DNA是空间定向的,因此栓系MNase优先进入DNA双螺旋的一面。MNase与TF结合可以约束它裂解附近的DNA,这表明了染色质纤维的灵活性(图3C)。
(四)CUT&RUN精确map染色质相关复合物
高分辨率mapping染色质的移动组成部分可以用ChIP的方法解决。例如,~1 megadalton 17亚基RSC核小体重构复合物动态地滑动其暂时吞噬的核小体(Lorch et al., 2010; Ramachandran et al., 2015)和Mot1 DNA转位酶动态地从高亲和力结合位点去除TATA结合蛋白(TBP) (Zentner and Henikoff, 2013; Auble et al., 1997)。尽管X-ChIP将核小体重塑复合物与最近的核小体交联,但native ChIP成功地捕获了酵母染色质重塑的作用位点,包括核苷缺失区(NDRs)和核小体(Zentner et al., 2013)。在CUT&RUN操作中,为了描述如此大的染色质相关复合物,我们发现必须提取总DNA而不是在原位溶解染色质,因为染色质可能太大而无法通过核孔扩散。因此,我们利用AMPure beads将所有DNA提取出来,优先去除较大的DNA片段。当将此修改的protocol应用于>2个数量级的消化范围内的Mot1时,我们观察到染色质profile与使用ORGANIC获得的染色质谱非常相似,但paired-end reads仅为15%(图4A)。正如预期的那样,在CUT&RUN和ORGANIC中都可以看到Mot1在TBP结合位点上游出现峰,这证实了在体内(Zentner和Henikoff, 2013)与体外(Wollmann et al., 2011)一样,Mot1在上游接近TBP。热图和平均图分析表明,<=120bp的片段与TBP位点接近,而>=150bp片段广泛地分布在局部附近。
我们还将CUT&RUN应用到RSC复合体的催化成分Sth1上。RSC的作用是在NDRs上滑动核小体,因此我们将酵母基因比对推测的+1核小体的双轴,就在转录起始位点的下游(Ramachandran et al.,2015)。在NDRs中,Sth1峰最为富集,其CUT&RUN图显示,随着消化时间在5 s到10 min之间,产量逐渐增加(图4B),表明使用我们的protocol可以获得定量限制消化。重要的是,我们观察到在最大消化时间内平行处理3XFLAG-Sth1核的阴性对照几乎是平的,这里省略了一抗flag抗体。我们对Sth1的CUT&RUN结果与Sth1 ORGANIC的结果相似(Ramachandran et al., 2015),但产量更高(图4C)。我们的结论是,CUT&RUN提供了高效的高分辨率染色质相关配合物的图谱,即使是对于那些非常大的动态复合物。
(六)CUT&RUN解决了罕见的不溶性DNA-结合蛋白复合物的问题
Abf1和Reb1是相对富集的TFs,但许多感兴趣的DNA结合蛋白量很少,因此很难通过ChIP进行profile。在芽殖酵母中,每条染色体只有一个着丝粒核小体,只有Abf1或Reb1的摩尔丰度的~1%。另一个挑战是研究着丝粒核小体,其中包含CenH3 (Cse4)组蛋白变体,H3是multi-megadalton着丝粒复合体的一部分(Akiyoshi et al.,2010),这造成了其高度不溶性(Krassovsky et al.,2012)。为了对Cse4核小体进行CUT&RUN分析,我们在消化后将样本平分,一个样本中只提取上清,另一个样本中提取总DNA。用这种方法,我们可以比较可溶性和不溶性着丝点复合体的回收率。同时,我们也对组蛋白H2A进行了类似的分析。通过取总染色质和可溶性染色质之间的差异,我们可以推断出各组蛋白在不溶性沉淀中的occupancy情况。正如不溶性着丝点所预期的那样,染色体上Cse4的occupancy在着丝粒处最高(图5A)。令人吃惊的是,不溶性H2A的occupancy也在着丝粒最多,它存在于每个核小体中,贯穿整个基因组。事实上,在所有16个酵母着丝粒中,我们观察到Cse4和H2A在消化过程中以~120 bp功能性着丝粒的富集非常相似,其分辨率比标准的X-ChIP好4倍(图5B)。我们还从使用CUT&RUN甲醛交联的细胞中提取了bead结合染色质的总DNA,得到了类似的结果(图5C)。证明了基本strategy可以应用于交联的细胞。
为了证实我们观察到的CUT&RUN上清和总DNA之间的差异是由于着丝粒染色质的溶解性不同导致的,我们在消化之前对样品进行了平分,其中一份我们用2 M NaCl停止了裂解反应,并回收了上清用于测序。我们在高盐组分中得到了与总DNA相似的结果。在着丝粒核小体中不溶性H2A的存在直接解决了对其组成的持续争议(Wisniewski et al., 2014; Henikoff et al., 2014; Aravamudhan et al., 2013; Shivaraju et al., 2012)。此外,由于酵母着丝粒核小体包裹>90% A+T的DNA (Krassovsky et al.,2012),着丝粒颗粒在>100倍的消化时间内的完整性(图5)表明,CUT&RUN不受MNase对AT-rich DNA的固有偏好的影响(Chung et al., 2010; McGhee and Felsenfeld, 1983)。我们的结论是,CUT&RUN可以绘制大的DNA-结合复合物,甚至是那些量很少的、不溶性的和AT丰富的。
(七)CUT&RUN以高分辨率绘制人类转录因子结合位点
建立了原理证明之后,我们接下来将CUT&RUN应用于人类K562细胞中的CCCTC-结合因子(CTCF)。为了直接比较各种方法的效率,我们为每种技术随机选择了1000万reads,并绘制原始分数作为每条序列read的信息指标。与酵母TFs的情况一样,CTCF CUT&RUN显示出比其他分析方法(包括标准的X-ChIPseq和ChIP-exo)更高的动态范围(图6A)。当与用DNaseI超敏感位点发现的CTCF的motif或之前鉴定的结合位点进行比对时,CUT&RUN和X-ChIP-seq CTCF热图显示出很强的一致性,CUT&RUN具有更高的动态范围(图6B)。当在低温下进行CUT&RUN时,无抗体对照组显示未检测到背景。与出芽酵母的TFs分析一样,我们观察到邻近片段的释放,这些片段与邻近CTCF位点的phased核小体相对应。通过绘制短CUT&RUN片段的末端位置(即连接着MNase的裂解位置),我们观察到明显的“tram-tracks”被44bp与CTCF相关的motif相隔开来。此外,精确的裂解在300倍的消化时间范围内,模式是一致的,在CTCF-结合位点的两侧都有一个主要的碱基切割位点,突出显示得到的极限消化(图6C)。这种模式表明,裂解位置是精确的。我们的结果表明,CUT&RUN在同一个实验中准确地映射了TFs和它们的两侧染色质。
CTCF有11个锌指,因此可能代表一种异常稳定的蛋白质- DNA相互作用。因此,我们使用CUT&RUN对Myc和Max进行了测试,这两种蛋白是basic-loop-helix蛋白,它们与短E-box motif结合(Phair et al.,2004)。CUT&RUN成功地在高分辨率下绘制了Myc和Max(图6 -图补充3A)。在Max的情况下,由于用ENCODE ChIP-seq数据的同一种抗体,可以进行定量比较,此处CUT&RUN具有更高的动态范围,因此能够有力地识别出更多的Max结合位点(图6 -补充图3B)。为了在E -box上结合DNA, Myc与Max形成异源二聚体(Blackwood et al., 1991),但Max还有其他的结合partners(Ayer and Eisenman, 1993),正如预期的那样,我们发现在几乎所有Myc结合位点都与Max有很高的重叠。相比之下,以前通过ENCODE X-ChIP-seq识别Myc和Max的结合位点的重合度就很低,Max位点少了10倍。然而,当我们将Max ENCODE的X-ChIP-seq数据与Max CUT&RUN位点进行比对时,我们看到了较高的occupancy(图6 -图补充3C),这表明X-ChIP-seq相对于CUT&RUN的较低动态范围是导致X-ChIP-seq无法识别这些Max结合位点的原因。
(八)CUT&RUN maps压缩的染色质中的组蛋白修饰
我们还考虑了抗体连接的MNase可能被排除在高等真核生物高度紧密的异染色区域之外的可能性,为了确定CUT&RUN 是否仅局限于分析蛋白质- DNA在常染色质区域的相互作用。因此,我们对抑制性组蛋白标记H3K27me3进行了CUT&RUN。通过分析CUT&RUN和编码X-ChIP-seq的1000万reads,我们观察到类似的H3K27me3图谱,但CUT&RUN有更高的动态范围 ,这表明蛋白质A-MNase能够接近压缩的染色质(图6-补充图4)。此外,H3K27me3从完整的核染色质裂解,释放到可溶性部分里,表明CUT&RUN适用于检测压缩的染色质protein-DNA相互作用。
(九)CUT&RUN定向绘制长距离基因组互作
由于邻近TFs的核小体大小的片段与含有TF的片段一起被释放,我们想知道在3D接触的位点是否也可能被切割和释放。染色体重塑捕获(3C)方法,如Hi-C和ChIA-PET (Tang et al., 2015; LiebermanAiden et al., 2009),是绘制三维全基因组接触map的首选技术。这些方法与X-ChIP相同的甲醛交联protocol是一样的,来识别3D相互作用,例如结合在增强子上的TF和通过co-activators与启动子接触之间的关系。在本例中,通过X-ChIP鉴定的蛋白结合位点将包括启动子和增强子,尽管其中一种相互作用是通过间接的蛋白质-蛋白质相互作用通过甲醛交联。但是在基于X-ChIP和基于3C的映射中都没有系统的方法来区分直接位点和间接位点。因此,我们尝试使用native ChIP来绘制CTCF结合位点,由于蛋白质与蛋白质相互作用的短暂性,我们之前展示的native ChIP只能定位包含TF特异性DNA结合otif的直接结合位点(Kasinathan et al.,2014)。我们开发了一种新的native ChIP 方法(附录1),并在没有蛋白重分布证据的情况下获得了接近完整的蛋白提取。在天然条件下,我们鉴定出2298个motif得分较高的位点。相比之下,CUT&RUN的映射CTCF发现~ 22000位点也出现在X-ChIP(图1)。正如预期的那样,所有native ChIP鉴定的位点也同样被CUT&RUN和X-ChIP检测了出来,显示类似的信号分布(图7)。这表明,与X-ChIP一样,CUT&RUN可以在高分辨率下发现直接(native CTCF峰)和间接(CUT&RUN peak only)染色质相互作用。
为了确认native ChIP 未观察到的CTCF CUT&RUN位点与相对应的接触位点,我们比较了直接和间接位点与ChIA-PET观察到的接触位点。CTCF ChIA-PET识别通过CTCF介导的相互作用基因组区域,但不能区分直接CTCF结合区域和间接结合区域。我们发现,对于一个典型的~ 1Mb基因组区域,所有高得分的ChIA-PET片段都有直接和间接位点的重叠(图8A)。由于CTCF的ChIA-PET 融合片段在几个kb的范围内(由使用的6-cutter限制性内切酶决定位点之间的距离),直接和间接的 CUT&RUN CTCF位点的映射都具有接近碱基对的分辨率。此外,在CTCF ChIA-PET数据中,有91%的直接位点存在,其中43%的ChIA-PET片段与间接位点相互作用,其余的包含一个较高的CUT&RUN信号(图8C),这表明这些间接位点与多个接触有关,刚好低于call peak阈值。为了进一步证明CUT&RUN可以检测到间接的相互作用,我们发现直接位点和间接位点之间的Hi-C相互作用频率很高,并且在间接位点的Hi-C评分和CUT&RUN信号之间存在定量相关性(图8B)。因此,通过比较CUT&RUN和native ChIP,可以在近碱基对分辨率下绘制接触位点,区分由远距离基因组相互作用导致的直接和间接的蛋白质结合位点,并确定这些接触的方向,这是其他方法无法做到的。
(十)CUT&RUN允许低细胞数的定量测量
典型的ChIP-seq实验需要大量的细胞,而低细胞数ChIP局限于含量丰富的蛋白(Kasinathan et al., 2014; Brind’Amour et al., 2015)。我们使用K562细胞数量从60万到1000万之间进行了CUT&RUN的CTCF分析。为了比较不同数据集的绝对occupancies,我们采用了一种简单的spike-in策略(参见材料和方法),可以对蛋白质occupancy进行准确的定量测量。当使用spike-in DNA进行标准化时,我们观察到裂解事件的数量与起始细胞数量成正比(图9)。此外,将数据归一化为比对到人类基因组的reads总数时,样本之间没有明显差异,说明少的实验材料可以保持高数据质量。
讨论
A simple method for chromatin profiling
CUT&RUN是基于Laemmli和同事的ChIC抗体链接核酸酶策略的(Schmid et al., 2004)。为了将ChIC应用到全基因组分析方法中,我们做了五个关键的修改。首先,我们将渗透的细胞或粗核固定到磁珠上,CUT&RUN在一天内完成,适合于自动化。其次,我们将抗体和pA-MNase与native未固定的核结合,在这些核上可以保留和获取表位(epitopes)。第三,由于固定的MNase裂解是零级反应,我们在ice-cold的温度下进行消化,这限制了释放片段的扩散,从而降低了背景。第四,我们使用天然的染色质,我们可以根据溶解度分级裂解片段(Sanders, 1978; Teves and Henikoff, 2012; Jahan et al., 2016),专门富集释放的染色质复合物。我们简单地去除不溶性大块染色质,只有染色质片段与两端裂解的颗粒进入上清。第五,提取DNA后,利用这些可溶性片段进行Illumina文库制备和paired-end DNA测序。我们发现,CUT&RUN在简单性、分辨率、稳定性、效率、数据质量和对高度不可溶解性的应用方面表现得和ChIP-seq一样好,甚至更好。CUT&RUN只需要其他高分辨率方法的1/10的测序深度,因为在原位进行反应所获得的背景很低。当MNase被激活时nuclei是完整的,CUT&RUN可以探测目标位点周围的局部环境。事实上,我们发现CUT&RUN在相对较低测序深度下复原了人类细胞中的三维接触位点,这些位点具有碱基对分辨率。
CUT&RUN的广泛应用
尽管在12年前,ChIC被描述为一种使用Southern blotting的基本mapping方法,但我们在它被发表之前并没注意到它。与此同时,单是ChIP-seq就被发表在近30,000篇文章中,用于分析几乎所有类型的染色质成分,包括组蛋白修饰、转录因子和染色质相关蛋白。像ChIP一样,CUT&RUN是基于抗体的,因此它可以应用于染色质上的任何表位,使它成为染色质谱分析的普遍方法。CUT&RUN提供了标准和spike-in的标准化选项的定量occupancy谱,通过我们的定制软件来处理和比较ChIP-seq和CUT&RUN数据集。CUT&RUN唯一的非标准特性是要求pA-MN融合蛋白,该蛋白可以从细菌培养中批量生产和纯化,产生足够的pA-MN以分析多于100,000个样品。
由于CUT&RUN与ChIP基于不同的原理,它可以解决交联、超声和溶解相关的问题。CUT&RUN背景低,因为裂解只发生在结合位点,而ChIP首先粉碎整个基因组,这些片段增加了全基因组的背景噪音。而对于CUT&RUN,使用简短的低温条件下没有检测到附近的背景噪音,缺乏对可接近的或AT富集的DNA的偏好,表明CUT&RUN不受ChIP的人为困扰(Teytelman et al., 2013; Park et al., 2013; Jain et al., 2015; Baranello et al., 2016;Kasinathan et al., 2014)。此外,CUT&RUN抗体结合发生在完整的细胞核中,类似于免疫荧光显微镜条件的环境。
低背景低成本
ChIP-seq分析通常包括normalization,以补偿样本之间reads的不同数量。在ChIP-seq中,全基因组片段化导致恒定的低密度全基因组背景,这为标准化提供了基础,例如,比较野生型和knockdown细胞系。虽然在含量丰富的蛋白质上normalization失败了,但这可以通过使用spike-in得到纠正(Bonhoure et al., 2014; Chen et al., 2015; Orlando et al.,2014)。然而,严格的 spike-in策略需要添加来自不同物种的细胞,而定量依赖于抗体交叉反应(Orlando et al., 2014)。在CUT&RUN中,尽管背景很低,但为了使样本之间的标准化,我们发现只要从不同物种中加入恒定的低数量的片段spike-in DNA就足够了,并且可以对蛋白质occupancy进行精确的定量。
低背景水平的CUT&RUN需要更少的读数来清晰地定义峰。例如,每个CTCF时间点只需要大约1000万对paired-end reads,类似于低分辨率ChIP-seq的要求,比ChIP-exo的要求少很多,后者需要大约1亿个CTCF的reads (Rhee and Pugh, 2011)。此外,对于Max和H3K27me3,CUT&RUN的1000万个reads提供了非常高的动态范围。这种成本效益使得CUT&RUN作为ChIP-seq的替代品具有吸引力,特别是在测序深度有限的情况下。我们可以将CUT&RUN的高效率归因于原位图谱和ChIP之间的根本区别:CUT&RUN保留了体内的3D构造,因此抗体通路仅暴露表面在一级结合反应中,而在ChIP中,抗体与可溶解的全基因组粉碎的细胞或细胞核内容物相互作用。此外,CUT&RUN裂解是一个有效的零级反应(zero-order reaction),导致在短暂的低温时间过程中对基因组中的所有结合表位稳定的颗粒释放。考虑到表位的丰度,我们估计我们对600,000个细胞的22000个直接和间接CTCF位点的映射与极低输入ChIP-seq的敏感性相当,该方法通常限于丰富的组蛋白修饰,如H3K27me3,在约5000个细胞(Brind’Amour et al., 2015)。然而超低输入 ChIP 只提供~ 2kb的分辨率,CUT&RUN提供近碱基对分辨率。
总而言之,CUT&RUN与ChIP及其衍生方法相比有许多实际的优势:低背景、低序列深度要求,易于使用,可自动化,同时允许spike-in精确量化。我们的结论是,在所有重要的方面,CUT&RUN提供了一个有吸引力的替代基于ChIP的方法。