引言
二代测序技术的出现,使得便宜有效的得到物种的基因组成为可能,大熊猫由于其濒危的地位和特殊的竹子食性受到广泛的关注,科学家们一直致力于研究并试图解决大熊猫危机,寻找影响大熊猫特殊生活习性的特殊基因组成分,本篇综述旨在阐述近十年,从第一个大熊猫基因组发表,到对大熊猫的基因组特征分析、比较基因组学、群体规模变化等相关的新科学研究进展。
正文
1. 大熊猫保护难题
大熊猫(Ailuropoda melanoleura)在生物分类学上属于哺乳纲、食肉目、熊科、大熊猫属。其99%的食物来源都是竹子,大熊猫的历史可以追溯到800万年前,被称为“活化石”。由于大熊猫的数目稀少,种群濒临灭绝,大熊猫被列为了中国国家一级保护动物。造成大熊猫数量稀少的主要原因有两个,第一个是人类活动,由于人口数量的增加以及人类对大熊猫生存环境的破坏,导致大熊猫食物和栖息地减少,种群数量下降,同时大熊猫的栖息地变得支离破碎,目前主要有中国陕西秦岭南坡,甘肃、四川交界的岷山,四川的邛崃山、大相岭、小相岭和大小凉山等彼此分割的6个区域,由于地理隔离的产生,各个种群之间无法进行基因交流,种群内近亲繁殖现象无法避免,导致大熊猫后代生命力降低,畸形甚至致死。第二个原因是大熊猫的生殖能力低,大熊猫一生中产仔数量少,由于大熊猫倾向于抚养同一胎中更加强壮的幼仔,抛弃体弱的幼仔,所以其幼仔存活率低,这使得大熊猫种群数量难以增长。
在人工饲养和生态环境保护的情况下,大熊猫的数量有所增加,然而,人工饲养并不能从根本上解决大熊猫繁殖艰难的问题,如何使得大熊猫像野生动物一样独立的在野外生存繁衍仍然是一个任重而道远的课题,通过对大熊猫基因组的研究,有望从遗传的方面了解熊猫生殖和特殊习性的特征,从而对大熊猫的繁育有更好的帮助。
2. 二代测序助力大熊猫基因组研究
第一代测序又称Sanger测序,始于1977年,通过在DNA片段的末端加入带荧光标记的双脱氧核糖核苷酸,结合凝胶电泳以及识别荧光信号的方法,可以测得DNA序列。Sanger测序有着准确度高的特点,然而由于测一条长度为X的DNA序列,需要生成至少X条DNA片段,以及中间各个步骤的繁琐,因此使用Sanger测序测大型的基因组,需要花费大量的人力和财力,因此无法用来经济的测大规模哺乳动物基因组(基因组大小用Gb计算)。第二代测序技术采用边合成边测序的方法,将DNA固定在固体表面,使用DNA聚合酶延长DNA,通过PCR放大信号,激发荧光信号依次得到碱基序列,二代测序的优点在于高通量,较低的成本以及自动化的过程可以节省测序的时间、人力和成本。使用第一代测序技术测大小为3Gb的人类基因组花费了3年时间,而利用第二代测序技术测人类基因组仅需要一周甚至更短的时间。
大熊猫第一个基因组草图由Ruiqiang等人[1]使用全基因组鸟枪法和Illumina测序平台大熊猫晶晶进行了全基因组测序,测序深度达到73x,使用SOAPdenovo对其进行de
novo组装。这个基因组的发布不仅推动了哺乳动物遗传学研究,同时也证明了第二代测序技术用于精确的,经济的和快速的组装大型真核基因组的可行性。2016年,Yibo等人[2]结合82x新的大熊猫基因组测序数据以及Ruiqiang等人发表的第一个大熊猫基因组测序数据重新组装了大熊猫基因组,新的大熊猫基因组质量的到了改善,其中contig N50从40kb提升到126.71kb,scaffold N50 从1.28Mb到9.9Mb。
3. 大熊猫基因组组成
2009年,Ruiqiang等人[1]发布了第一个大熊猫基因组草图,大熊猫基因组大小为2.25Gb,覆盖了整个基因组的94%,经过注释得到21001个基因,在二倍体基因组中鉴定了270万个杂合的SNP,267,958个小indels。通过基因组组成分析,大熊猫基因组相比较于狗的基因组存在着更低的分化率。Ruiqiang等人[1]在大熊猫基因组中发现有编码消化酶、蛋白酶、淀粉酶、脂肪酶、纤维素酶、乳糖酶、转化酶和麦芽糖酶的基因,表明大熊猫可能具备肉食消化系统所需的所有成分,而没有发现纤维素酶基因的同源物,这表明大熊猫吃竹子的饮食习惯可能更依赖于其肠道微生物群,而非自己的基因组组成。同时大熊猫的T1R1基因成为一个假基因,这可能是大熊猫对肉类及氨基酸类的鲜味不敏感的原因。关于大熊猫繁殖力低的现象,科学家们发现了假基因FSHB2,这个假基因是否关乎大熊猫的生殖特征还有待进一步的研究。2015年,Huang等人[3]鉴定了大熊猫基因组中的微卫星,共鉴定出154,677个四核苷酸微卫星,其中15个被发现为多态性和稳定基因座。2018年,Peng等人[4]重新注释了大熊猫基因组的转座因子,SINEC1_AMe,SINEC1B_AMe和SINEC_C1是大熊猫基因组中最丰富的三大Can-SINE亚家族,SINEC1_AMe和SINEC1B_AMe最为活跃。
4. 大熊猫比较基因组学
2015年,Yonggang等人[5]比较分析了大熊猫和人类、北极熊、雪貂、狗、猫、老虎、老鼠的基因组。在大熊猫的双氧化酶2 (DUOX2)基因中发现了第16外显子中含有C到T的单次取代,导致过早终止密码子(TGA),它与人类的DUOX2基因是同源的,负责催化水转化为过氧化氢的多氧编码跨膜蛋白,用于T4和T3合成的最后一步。转录组数据中也观察到这种突变,表明DUOX2的转录本不会被翻译成完整的蛋白。在人类和小鼠中,DUOX2的功能缺失突变会导致甲状腺功能减退。可能成为大熊猫低能量代谢的原因之一。
2016年,Yibo等人[2]比较分析了小熊猫(Aliurus fulgens)基因组和大熊猫基因组,两个物种都以竹子为食,同时具有适应于取食竹子的假拇指,在基因组层面两只熊猫的鲜味受体基因TAS1R1都是假基因,这可能使得它们对肉类不敏感,同时肢体发育基因DYNC2H1和PCNT经历了自适应收敛,可能是假拇指发育的重要候选基因。
5. 大熊猫群体变化历史
2012年,Shancen等人[6]对34只野生大熊猫进行了全基因测序,结合Ruiqiang等人发表的大熊猫基因组草图,揭示了大熊猫的演化历史。通过微卫星位点分析,证明了大熊猫具有很大的遗传多样性。Shancen等人[6]使用pairwise sequentially Markovian
coalescent (PSMC)[7]模型来研究大熊猫基因组中杂合子的局部密度变化。大熊猫起源于800万年前,其数量在100万年前达到高峰,70万年前熊猫数量开始下降,由于巴科尼熊猫比侏儒熊猫更适应寒冷的天气,所以从75万年前开始巴科尼熊猫取代了侏儒熊猫,在20万年前大熊猫数量进入瓶颈期,这个过程与历史上中国处于冰川时期时间相吻合,冰川消退之后大熊猫数量于4万年前达到高峰,2万年前大熊猫又经历了一次冰期,导致大量的栖息地丧失,再加上人为的猎杀,使得大熊猫数量2万年前达到瓶颈。
结论
近十年来,通过对基因组成分的分析以及比较基因组学,在大熊猫的特殊食性上研究了一些可能的机制,比如假基因TAS1R1。而在大熊猫的生育力研究方面还有很大的研究空间。比较基因组学依然是确定生物功能遗传基础的有力工具。同时多组学分析应用于大熊猫相关研究及其他哺乳类动物具有很广阔的前景。
Reference:
[1]. Li R, Fan W, Tian G, Zhu H, He L, Cai J, etal. The sequence and de novo assembly of the giant panda genome[J]. Nature.2009;463:311.
[2]. Hu Y, Wu Q, Ma S, Ma T, Shan L, Wang X, et al. Comparativegenomics reveals convergent evolution between the bamboo-eating giant and redpandas[J]. Proceedings of the National Academy of Sciences. 2017;114(5):1081.
[3]. Huang J, Li Y-Z, Du L-M, Yang B, Shen F-J, Zhang H-M, et al.Genome-wide survey and analysis of microsatellites in giant panda (Ailuropodamelanoleuca), with a focus on the applications of a novel microsatellite markersystem[J]. BMC Genomics. 2015;16(1):61.
[4]. Peng C, Niu L, Deng J, Yu J, Zhang X, Zhou C, et al. Can-SINEdynamics in the giant panda and three other Caniformia genomes[J]. Mobile DNA.2018;9(1):32.
[5]. Nie Y, Speakman JR, Wu Q, Zhang C, Hu Y, Xia M, et al.Exceptionally low daily energy expenditure in the bamboo-eating giant panda[J].Science. 2015;349(6244):171.
[6]. Zhao S, Zheng P, Dong S, Zhan X, Wu Q, Guo X, et al. Whole-genomesequencing of giant pandas provides insights into demographic history and localadaptation[J]. Nature Genetics. 2012;45:67.
[7]. Li H, Durbin R. Inference of human population history fromindividual whole-genome sequences[J]. Nature. 2011;475:493.