●英文题目:《The origin of domestication genes in goats》
●期刊:Science Advances
●影响因子:2022_IF=14.957;中科大类: 综合性期刊1区; 中科小类: 综合性期刊1区; JCR分区: Q1
●发文单位:西北农林科技大学、中国科学院昆明动物所、西北工业大学等多个机构
●文章作者:西北农林科技大学郑竹清、王喜宏、李鸣、李运嘉等为等为共同第一作者;西北农林科技大教授姜雨、陈玉林,西北工业大学王文,为文章共同通讯作者
●摘要:山羊驯化对农业和文明至关重要,但其潜在的遗传变化和选择机制仍不清楚。在这里,我们分析了全球家养山羊、野生山羊物种和古代山羊的基因组,提供了从西高加索类羱羊物种到家山羊祖先的古代渗入事件的证据。一个具有强烈选择特征的渗入基因座包含 MUC6 基因,该基因编码胃肠道分泌的粘蛋白。实验表明,几乎固定的渗入单倍型赋予对胃肠道病原体增强的免疫抵抗力。另一个具有强烈选择信号的位点可能与行为有关。这两个位点的选定等位基因分别至少在 7200 年和 8100 年前出现在家养山羊中,并且随着无处不在的现代线粒体单倍群 A 的扩展而增加到高频。追踪这些考古学上神秘的进化转变提供了对动物驯化机制的新见解。
●前言:
对于自由生活的动物,驯化表现出对其生理和行为的压力,而使其极端转变到高密度和易患病的人为环境,特别是对于食草动物。山羊(Capra hircus)是最早驯化的家畜品种之一,表现出显著的适应性和多功能性,它与人类的扩散密切相关。最近的研究已经确定了山羊驯化过程中选择的候选目标,包括与色素沉着、药物代谢和产奶有关的基因座,然而,在驯化的早期阶段涉及适应的关键基因的进化动态仍然不清楚。
山羊的驯化被认为开始于大约11,000年前的伊朗野山羊 bezoar 品种(Capra aegagrus)。然而,其他野生山羊 Capra 品种分布广泛,其中许多可与家山羊杂交。他们对山羊驯化过程的贡献仍然未被探索。适应性变异的渗入已被广泛认为是人类 ,绵羊和牛中显着的进化现象,并且可能显著有效地增加适应性,而不会产生负面的多效性效应,如其他物种所证明的。在这里,我们对分布在世界各地的现代山羊种群、六个野生山羊种群和以前发表的古代山羊基因组进行了全面的种群基因组调查,以研究在山羊驯化过程中选择的关键遗传变异的时间变化。
●结果:
1、家山羊种群结构与起源
我们测序了101个山羊基因组(覆盖率为3至47倍,平均为12倍) ,包括从三个不同大陆收集的88只家山羊,一只 bezoar ,一只阿尔卑斯北山羊 Alpine ibex (Capra ibex) ,三只西伯利亚北山羊 Siberian ibex (Capra sibirica) ,三只马克霍尔山羊 Markhors (Capra falconeri),一只西高加索羱羊 West Caucasian tur (Capra caucasica), 和四只努比亚北山羊和家山羊的杂交种 Nubian ibex × domestic goat hybrids (Capra nubiana × C. hircus)(图1A)。我们还对5个古代山羊样本进行了测序,覆盖率为 0.04至13.44倍(图1A) ,包括新石器时代最早的已知中国考古样本。连同现代山羊和 bezoar 的公开可用的基因组序列以及来自 (表 S4) 的古代基因组,我们汇集了世界范围的164只现代家养山羊,52只古代山羊,24只现代 bezoar 和4只古代 bezoar 。
全基因组邻接系统发生树显示,所有家养山羊都与 bezoar 形成单系姊妹谱系(图1B) ,证实了现代家养山羊是 bezoar-like 祖先的后代。其他四种被称为 Ibex-like 物种的 野生 Capra (C.ibex,C.sibirica,C.falconeri 和 C.caucasica) ,完全属于与 bezoar 分歧的另一个分支(图1B)。PCA 显示,在中东(图1A)附近的驯化中心收集的三个 bezoar 种群的群体结构和聚类结果与其地理起源位置相对应(图1C)。在家养山羊中,PCA 和 ADMIXTURE (k = 3)显示亚洲山羊在遗传上与欧洲(EUR)和非洲(AFR)样本不同(图1,D 和 E)。在 k = 6时,亚洲山羊进一步分为两个地理亚群: 西南亚-南亚(SWA-SAS)和东亚(EAS)(图1E)。TreeMix和基于单倍型的统计也支持这种地理结构,与现今家养山羊种群的祖先沿着非洲-欧亚大陆的东西轴线不同的传播路线的假设是一致的(图2A )。远离驯化中心(非 SWA)的种群连锁不平衡增加,遗传多样性降低,这一观察结果进一步支持了上述扩散假设。(图S10).
我们的群体演化分析使用了MSMC,SMC + + 和 ∂a∂i 推测的现代亚洲和欧洲山羊种群之间的分化时间早于考古学估计的驯化时间(约11000年前)(图 S12)。此外, D统计显示, 札格罗斯山脉的 bezoar 对东部驯化群体显示出较高的遗传亲和力,而阿塞拜疆的 bezoar 对西部驯化群体显示出较高的亲和力(图2B)。 因此,东西群体对之间发现的较深的溯祖时间可以通过它们起源于结构化祖先 bezoar 种群中或通过从不同的地方 bezoar 种群驯养后招募来解释。
2、基因从 ibex-like 流向驯化前的 bezoar 和现代山羊
D统计显示,4种 ibex-like 与古代和现代山羊具有显著的等位基因共享信号,表明了他们之间的混合(图2c)。然后,我们在20kb的滑动窗口中使用D统计和状态识别方法,研究了 ibex-like 和家养山羊之间的全基因组混合模式。我们利用Sprime和最大似然(ML)系统发育树进一步验证了候选的渐渗区域。采用保守的标准(即只保留山羊中推测的频率高于0.1的渐渗单倍型),我们鉴定出112个基因组片段与81个蛋白质编码基因重叠,这些基因具有渐渗特征(图2d)。GO和KEGG富集分析表明,最显著的丰富类别是 amoebiasis,与寄生虫入侵和免疫抑制相关,包括四个基因(SERPINB3,SERPINB4,CD1B,COL4A4)。另外三个基因(BPI、MAN2A1和CD2AP)也参与了免疫功能。在这些片段中,我们观察到一个来自西高加索羱羊的等位基因(图S17),与该物种和家养山羊具有最大的全基因组等位基因共享相一致(图2C)。
在研究西高加索羱羊的混合历史时,我们发现西高加索羱羊与所有四种预驯化的 bezoar (一种亚美尼亚 bezoar 可追溯到 47,000 多年前,三种安纳托利亚 bezoar 可追溯到约 13,000 年前)共享更多等位基因,与现今的 bezoar 和驯化山羊相比尤其是亚美尼亚 bezoar 共享更多等位基因(图 2E)。 f3(现代 bezoar ,西高加索羱羊;目标群体)统计数据支持从西高加索羱羊到古代亚美尼亚 bezoar 的基因流动。加上三种驯化前的安纳托利亚 bezoar 具有 tur-like 线粒体单倍型这一事实,我们的结果为 bezoar 与 tur-like 的驯化前混合事件提供了证据。 TreeMix 分析和西高加索 tur 与古代亚美尼亚 bezoar 之间的地理邻近性进一步支持了这一古老的混合事件,而两者又比任何其他现存的 ibex-like 更接近山羊驯化中心(图 2A)。尽管所有现代山羊基因组都表明与 tur 混合,但与亚洲山羊相比,新石器时代的巴尔干山羊和现代 EUR 和 AFR 山羊显示出更多与 tur 的等位基因共享(图 S15B),这可能是因为它们与古代亚美尼亚和安纳托利亚 bezoar 的遗传亲和力更高(图2E)。因此,来自 tur-like 的驯化前基因渗入可能为古代 bezoar 提供了等位基因,从而为早期驯化的山羊及其衍生的现代种群提供了等位基因。
值得注意的是,29 号染色体上的一个渗入区域在现代全球家养山羊中具有几乎固定的渗入单倍型(频率 = 95.7%)(图 2F 和图 S22A)。该区域包含一个完整的蛋白质编码基因 MUC6,它编码胃肠道分泌的粘蛋白,形成保护性糖蛋白外壳,参与宿主对多种胃肠道病原体入侵的先天免疫反应。我们在已测序的野生山羊基因组中搜索了潜在的供体种群。利用MUC6的非重复区域构建的单倍型网络表明,最常见的家养单倍型(MUC6D)与西高加索 tur 相似,仅相差一个突变,但不同于家山羊的次要频率单倍型和 bezoar 常见的单倍型(MUC6B)(图 2F)。为了进一步验证这种基因渗入信号,我们估计了不同单倍型的最近共同祖先,并研究了作用于从头突变或持续变异的选择是否可能导致家山羊这一区域的模式。溯祖时间估计和中性模拟表明,在没有种间基因流动的情况下,观察到的单倍型分化模式极不可能发生。因此,山羊中几乎固定的 MUC6D 很可能是从接近西高加索 tur 的谱系渗入的,这与全基因组信号一致。
3、驯化介导的免疫和神经基因的选择
为了确定山羊驯化中的关键选择性扫描,我们通过估计FST、 Π ln-ratio bezoar/家养)和XP-EHH,将全球家养山羊种群与所有 24 只 bezoar 在沿着基因组的 50-kb 滑动窗口中进行了比较(图 S19)。我们将所有三个统计数据(FST > 0.195、Π ln-ratio > 0.395 和 XP-EHH > 2.10)中具有显着值(Z test,P < 0.005)的窗口定义为假定的选择性扫描区域。合并连续的离群值窗口后,确定了包含 403 个蛋白质编码基因的 105 个独特区域(图 3A)。其中 18 个区域已在之前的驯化扫描中识别出来,包括与免疫、神经通路或过程、色素沉着以及与牛奶成分和毛发特征相关的生产力特征相关的表型效应相关的区域。与先前研究的适量的重叠主要是由于样本集、选择扫描方法和参考基因组的不同版本的差异。
KEGG 分析表明,14 条显着富集的途径中有 9 条( P < 0.01)与免疫相关(P = 5 × 10-3 至 2.35 × 10-7)(图 3B),包括甲型流感、疟疾、非洲锥虫病、自然杀伤细胞介导的细胞毒性、麻疹、单纯疱疹病毒感染、细胞因子-细胞因子受体相互作用、丙型肝炎和脂肪细胞因子信号通路。我们调查了文献并确定了另外 40 个具有免疫功能的基因,总共获得了包含 77 个免疫相关基因的 41 个区域。其中,MUC6 区域的 FST 特别高,我们检测到该基因中 16 个错义SNP突变的 FST > 0.88(加窗口 FST = 0.89,Π ln-ratio = 1.01,XP-EHH = 5.25;图 3C)。预测的 16 个错义突变中有两个是有害的,这些有害等位基因在家养山羊种群中的发生频率非常低(平均值 = 0.038)(图 S21)。总体而言,该区域包含 228 个 SNP 几乎是现代山羊固定的衍生型等位基因(频率 > 95%,bezoar 中不存在)占整个基因组中此类变异的 93.8%(总共 243 个),说明该选择信号的奇异性质。
选择富集分析进一步确定了 12 个参与神经活性配体-受体相互作用的基因(P = 3.70 × 10-5)。我们观察到另外 37 个与神经系统其他功能相关的基因,这些基因在山羊驯化过程中被选择。位于 15 号染色体上的一个基因组区域显示出最强的组合选择信号(FST = 0.90,Π ln-ratio = 3.20,XP-EHH = 8.09)(图 3A)。Tajima's D 值为较大负值、CLR得分较高以及家养山羊中广泛的单倍型共享的证据都表明该位点存在强阳性选择(图 3D 和图 S22B)。该基因座包含 15 个几乎固定的家山羊衍生型等位基因的 SNP,并包含两个蛋白质编码基因 STIM1 和 RRM1。 STIM1 是一种内质网 Ca2+ 传感器,参与调节神经系统中的 Ca2+ 和代谢型谷氨酸受体信号转导。它以调节小脑浦肯野神经元的兴奋性而闻名,而小脑浦肯野神经元在运动学习和感觉-运动信息整合中起着关键作用。 RRM1 编码核糖核苷二磷酸还原酶大亚基,这是一种生产脱氧核糖核苷酸所必需的酶,并影响小鼠对丙戊酸诱导的神经管缺陷的敏感性。因此,我们假设这个强烈选择的位点可能与神经功能或行为有关。
4、渗入基因 MUC6 在病原体耐药性中起着重要作用
5、驯化的 STIM1-RRM1 和 MUC6 等位基因的起源和扩散