一、增强子
所谓增强子(Enhancer),位于结构基因附近,是一类非编码DNA顺式作用元件,在真核生物的发育过程中通过结合转录因子、辅因子以及染色质复合物作用于启动子,可以激活或增强基因的转录。
简单说:增强子是能够增加启动子活性从而增加基因转录频率的DNA序列。
1、增强子通常具有以下特点:
① 在转录起始点5'或3'侧均能起作用;
② 相对于启动子的任一指向均能起作用;
③ 发挥作用与受控基因的远近距离相对无关;
④ 对异源性启动子也能发挥作用;
⑤通常具有一些短的重复顺序。
2、研究增强子的数据库:
1、EnhancerAtlas :一个整合的增强子数据库。
http://www.enhanceratlas.org/index.php
2、dbSUPER:超级增强子数据库。它不仅列出了与超级增强子相关的基因,还链接到外部数据库,如GeneCards,UniProt和Entrez。
https://omictools.com/dbsuper-tool
3、SEdb: 一个“超级”全面的人类超级增强子数据库。
http://www.licpathway.net/sedb/
4、VISTA Enhancer Brower:增强子实验验证数据集。
二、鉴别增强子
有以下几种方法:
(1)Chip-seq/Chip-chip识别转录因子结合位点,
(2) 增强子特异的因子也可用于识别增强子,如EP300,EP300 的结合位点常用于预测增强子;
(3)RNA 聚合酶 Ⅱ 能与数千个增强子结合,所以 RNA 聚合酶 Ⅱ 的最大亚基POLR2A 也可寻找增强子位点;
(4)脱氧核糖核酸酶 Ⅰ 超敏位点 (DHS) 代表开放染色质区域,许多覆盖有增强子;
(5)甲醛辅助分离调控元件 (FAIRE) 结合测序,能识别大量激活调控元件,包括增强子;
(6) 一些组蛋白修饰模式反应了不同的染色质状态,如H3K4me1 和 H3K27ac 的结合广泛用于增强子的标记;
(7) 增强子序列能够转录,转录的增强子RNA(eRNA) 也是激活增强子的标志;
(8)染色体 3D 构象的方法 (e.g. 5C and ChIA-PET, Capture-C) 也能提供增强子 - 启动子相互作用的信息。
原文:https://www.163.com/dy/article/FC1ERVVE0532AN5N.html
1、 增强子鉴定
目前对增强子鉴定,主要采用染色质免疫共沉淀技术(ChIP-seq) 针对活性增强子相关联的因子或组蛋白修饰进行检测,如转录因子、转录辅激活因子(如Mediator、p300)、组蛋白修饰H3K27ac 和H3K4me1等。活性增强子通常同时含有H3K27ac 和H3K4me1 修饰,而静态增强子(poised enhancer)一般同时具有H3K4me1 和H3K27me3 组蛋白标记
1.1组蛋白修饰的ChIP-seq分析
组蛋白修饰能预测染色质的类型、区分基因组功能元件,例如H3K4me1、H3K27ac通常在增强子区域存在富集。一般而言,当增强子区只有H3K4me1富集时,该增强子处于平衡状态;而当增强子区域同时富集H3K4me1和H3K27ac时,该增强子处于激活状态促进基因表达。
得益于高通量测序技术的发展,目前ChIP-seq试验已经广泛用于识别、鉴定增强子结构区。这种方法也是文献中的常规思路,灵敏度较高。
可再进一步通过富含谱系特异性TF、共激活因子以及组蛋白修饰标记H3K27ac等特征,区分增强子簇(称为超级增强子)与普通增强子。
1.2数据库获取注释
例如ENCODE、FANTOM、HEP等,都能够获取增强子注释信息。它们是收集已知试验整理的,其中也广泛包含了ChIP-seq。
但数据库之间存在差异,并且增强子具有组织特异性,因此后续仍待鉴定。
原文:https://www.sohu.com/a/400410202_120736615
2、通过CHIP-seq分析鉴别基因启动子和增强子
可通过CHIP-seq分析组蛋白修饰的分布寻找基因的启动子区和增强子区域及其是激活或抑制基因表达
H3K4me1可作为增强子的标志
H3K4me3作为启动子标志
异染色质是染色质的浓缩,转录无活性状态,H3K9甲基化是异染色质的标志。H3K27me1和H3K9me3存在于着丝粒异染色质区域,而H3K27me3和H3K9me2共同存在于抑制的常染色质区域中。H3K9ac也与H3K14ac和H3K4me3高度共存共同作为活性基因启动子的标志。
原文:http://jianshu.com/p/8aca72809c5c?utm_source=desktop
三、增强子相互作用靶标的预测
仅识别增强子是意义不大的,重要的是找到增强子调控的下游基因,或者定位调控通路轴,通过基因或通路功能的改变以解释观察到的生物学现象或过程
首先就是靶基因的预测。大多数情况下,通过已知增强子预测靶基因,方法有如下几种。并且在鉴定到候选的靶基因后,可再进一步结合组间(如处理组和对照组)差异基因表达列表,进一步定位关注的目标基因。
1、通过已知的数据库
SEdb,人类超级增强子相关的数据库,对于某特定超级增强子,存在几种类型的超级增强子-基因对应关系。同时还包含了超级增强子来源的细胞、组织类型等信息,可据此获取超级增强子-基因关系对。
SEanalysis,可以根据超级增强子、细胞组织类型、转录因子、信号传导途径或基因进行搜索,获知超级增强子与相互作用基因或转录因子等的关系
优点:信息丰富,准确、快速。
缺点:受数据库总量的限制。
2、根据基因注释,在增强子上下游位置寻找临近基因
如果增强子在基因组中的位置已知,可以根据已知的人基因组注释信息,在增强子上下游一定区域寻找相关的基因,如邻近基因、重叠的基因等,将它们视为直接的靶标。这种方法即基于“增强子与其邻近的mRNA启动子相互作用”这一观点。
优点:快速简单。
缺点:增强子存在远端调控,因此无法适用于距离很远但真实受到调控的靶基因。
3、基于增强子RNA和基因启动子的相关活性
某些增强子以RNA形式发挥作用,即eRNA,通常通过和转录因子结合调控靶基因。可通过检测eRNA与靶基因RNA之间的相关表达活性,若相关性很强,则可将基因视为该增强子的候选靶标。
如果有必要,也可以结合上述方法,指定一定的距离范围。
优点:可识别组织特异性的相互作用。
缺点:增强子eRNA和基因转录的RNA具有多对多的关系,如一个启动子可以与多个增强子关联,一个增强子也可以与多个启动子关联。并且无法有效识别eRNA和基因转录的RNA之间是直接还是间接的相互作用。
原文:https://www.sohu.com/a/400410202_120736615
四、应用
鉴定出增强子之后,可以根据基因位置预测超级增强子所调控的编码蛋白基因和非编码RNA的表达,通过结合转录组测序技术,可以对超级增强子和肿瘤异常高表达的mRNA、lncRNA、circRNA、miRNA进行关联分析,从而推断关键的超级增强子,进一步锁定肿瘤相关的基因,有利于指导下一步的抗肿瘤功能研究。