2009年,Job Dekker首次开发出Hi-C技术,实现了全基因组单位内染色体片段间相互作用的捕获。高通量染色体三维构象捕获技术Hi-C(High-throughput chromosome conformation capture)作为国自然热点前沿技术,是分析染色质三维空间结构的经典方法,被广泛应用于研究三维基因组结构和表观遗传调控,以获得全基因组范围内整个染色质DNA在空间位置上的关系与相互作用模式、高分辨率的染色质三维结构信息。
揭示染色体互作模式,描绘三维结构重构图谱
研究关键词:染色质区室A/B Compartment 、拓扑结构域TAD与染色环 Chromatin loops;3D图谱
01 A Compartment:开放的染色质,表达活跃,基因丰富,包含用于主动转录的组蛋白标记,通常位于细胞核的内部;
02 B Compartment:表达不活跃,基因缺乏,结构紧凑,含有基因沉默的组蛋白标志物,位于核的外围;
03 TAD:染色质区室中互作相对频繁的基因组区域,富含H3K27me3修饰、RNA聚合酶II以及CTCF结合位点,通常与组蛋白修饰、甲基化修饰有关;
04 Loop:局部区域的两个高频位点互作是成环的基础。loop是染色质在空间中形成的环状结构,是区室中互作频率相对周围较强的区域。这种结构可以使在线性距离很远的元件得以相遇,以此来调控基因的转录和表达:比如,从空间上拉近启动子和增强子的距离,促使基因的转录起始。
当生物体生命活动/生理状态发生变化时(通常在表观显现,“由表及里”),常常伴随染色质区室B to A/A to B的转换,在此过程中,染色质状态、开放性或者可及性会产生变化,进而影响一系列调控因子或元件与开放染色质区域的结合状态(与ATAC-seq互相验证);与此同时,TAD边界也发生一定程度的改变,随之而来的相关组蛋白修饰或调控因子水平的变化也会反过来影响染色质松散程度和开放性(可结合CUT&TAG测序组学研究组蛋白修饰和转录因子调控变化),进而影响基因的转录表达。
此外,据研究表明,大部分的A/B区室、TAD在不同的细胞类型中相对保守,而loop经常连接启动子与增强子,与基因的激活有关(与RNA-seq关联分析验证基因表达情况),更具动态变化,因此promoter-enhancer的互作模式也会依据调控因子的水平变化产生差异,更具有针对性。
因此,锚定重点染色质区室A/B转换、筛选差异TAD边界甚至loop结构,分析TAD边界上相关组蛋白修饰变化情况以及增强子的鉴定是分析染色质远距离互作、空间结构的重要环节。而基于染色体全部的互作信息,通过数学模型将二维的染色体互作信息转化为三维空间结构,是反映全基因组范围内染色体互作情况的重要生信分析工具(3D图谱,见第二部分)。
剖析染色体3D空间结构与遗传进化史
泛三维基因组图谱分析
在互作不同层级的基础上(即染色质区室A/B Compartment 、拓扑结构域TAD与染色质环loop),重构不同样本的三维结构图谱(3D图谱),进行不同物种间三维结构的比较,进而揭示物种间的基因组进化特征和资源多样性演化机制,并挖掘基因组大小演化中空间结构的重组规律。另一方面,同一物种不同发育阶段的三维结构比较,也能够剖析物种远距离调控的三维空间互作机制。因此,基于不同个体间TAD/loop等边界的保守性及其在进化过程中的获得和丢失分析,以及TAD富集区域的基因、转座元件TE或染色体重排等特征,对于三维结构的重塑十分必要。另外,与基因组、转录组和表观组等组学技术结合,进一步探讨三维基因组结构对其功能和基因组遗传进化的影响。
解锁个体单体型奥秘
单体型(Haplotype),又称为单倍体基因型,指在同一染色体上进行共同遗传的多个基因座上等位基因的组合,即若干个决定同一性状的紧密连锁的基因构成的基因型;亦指一个染色单体中具有统计学关联的一类单核苷酸多态性(SNP)。由于一个基因的SNP往往不能揭示其与性状表型的真实关联,因而针对多个位点的单倍型分析成为解释错综复杂调控机理的有效手段。
以染色质互作为基础的染色体跨度的个体单体型的构建和群体中各种单倍型频率的计算,可以应用于人类健康研究中比如临床诊断、器官移植中供受体的匹配检测、癌症或复杂疾病细胞拓扑结构特征的研究;也可以应用于动植物的分子育种中,如研究复杂性状的基因调控网络与机制。
案例分享
Cell Death & Differentiation:Hi-C揭示了干细胞在分化过程中对染色质三维结构的影响 [2]
该研究构建了hMSC向脂肪与成骨细胞分化的高分辨率染色质三维互作动态图谱,鉴定出分化方向特异性的染色质环结构,发现这些染色质环的形成伴随着增强子的特异性激活以及转录因子的特异性结合,影响基因表达的选择性激活。通过构建分化特异性调控网络,鉴定了细胞命运决定性调控环路,并结合CRISPR/Cas9、3D-FISH等技术验证了调控环路对基因表达的影响。该研究结果通过Hi-C、ATAC、ChIP、RNA多组学测序数据揭示了hMSC在向脂肪、成骨细胞分化过程中的三维基因组与表观遗传修饰的动态景观对于促进干细胞命运转变过程中的重要作用,为理解hMSC的命运决定过程提供了新的思路。
BMC Biology:Hi-C技术绘制脊椎动物三维基因组结构图谱 [3]
该研究利用12种主要脊椎动物的成纤维细胞系Hi-C数据,绘制了不同物种的三维基因组结构图谱,表明了基因组大小和染色体长度与最上层的三维基因组结构单元——染色体疆域的形成有关,而更精细的下层结构特征,包括DNA的局部转录可及性,是通过脊椎动物的进化选择的;TAD的保守性似乎与物种间基因表达的模块化密切相关;在基因组结构的进化过程中,LINE和SINE转座因子可能分别参与异染色质和常染色质的组织。该研究揭示了决定跨物种功能基因保守性和转录调控的三维基因组结构特征,扩展了人们对基因组结构形成机制的理解,为农业动植物基因组进化和重要经济性状的三维基因组学研究提供了参考依据。