本文内容摘选自棉花那些事|深入解析_基因组 (sohu.com)
棉花都属于棉属(Gossypium),棉属是棉族(Gossypium)里最大的属,共包含52个种。按照基因组类型,可以分为A、B、C、D、E、F、G和K八个不同的类型!
上表其中除了草棉(G. herbaceum;A1)、亚洲棉(G. arboreum;A2)、陆地棉(G.hirsutum;AD1)和海岛棉(G. barbadense;AD2)四个栽培种外,其余均是野生棉!
大多数野生棉花的纤维非常短,紧密地附着在种子上;只有四种栽培棉花被培养以生产纺织纤维(图1)。其中经济价值较高的是两个四倍体——陆地棉和海岛棉。
而我国新疆主要种植的“新陆早”,就是选育的早熟四倍体陆地棉新品种。四倍体棉种(2n=2x=52)是由染色体A组和染色体D组杂交,随后染色体加倍形成的异源多倍体。像其他多倍体物种一样,四倍体棉里面的两个亚基因组在进化速率、基因丢失、表达偏好和甲基化水平等方面表现出明显的不对称演化。不同的棉种有着不同的植物结构——从野生多年生小乔木和灌木到栽培草本一年生植物,具有不同的叶形和不同的纤维特性(图1)。
图1 不同棉花表型特征以及分布
(Huang G et al., Annu Rev Plant Bio 2021 )
早从2012年开始,Wang、Paterson等学者就通过全基因组鸟枪法等方式破译了我们的大哥——雷蒙德氏棉(G. raimondii;D5;被认为是所有多倍体棉花的潜在供体)的基因组。其基因组的首次面世,惊艳了众人。后来越来越多的科研学者加入了我们棉花功能基因组学研究的大部队。2015年,最广泛栽培的棉花品种陆地棉TM-1基因组草图分别在两项独立的研究中被发布,并随着技术的发展,基因组的序列不断被迭代更新,至今已有7个TM-1品种以及一个ZM24品种陆地棉基因组被公布(图2)。研究表明在TM-1和ZM24之间的At亚基因组第8染色体上存在三个大规模(>4Mb)倒位,导致两个群体的单倍型分离,并抑制了该区域的减数分裂重组[3]。
棉花基因组的大小在800 Mb-2.7 Gb之间,组装连续性最高的ContigN50可达9 Mb(图2)。截至目前,全球已报道了来自10种不同棉花品种的24个基因组,包括二倍体亚洲棉、雷蒙德氏棉、草棉、澳洲棉、陆地棉、海岛棉等。相关研究中有 9篇基因组发表于NG,2篇见刊NBT
(Yang Z et al., Genome Biology 2020; Chen Z J et al.,Nature Genetics 2020; Huang G et al.,Nature Genetics 2020)
锦葵科系统发育树表明,棉属最接近Gossypioides/Kokia属,D5基因组大小与木棉(Bombax ceiba) (895 Mb)和榴莲(Durio zibethinus) (715 Mb)相似。二倍体D-基因组棉花起源于∼6.6百万年前,随后在千叶期(∼0.5−2.0百万年)产生多元化。
红线表示预测可能的关系,没有该属的基因组序列信息,阴影代表棉花(Huang G et al., Annu Rev Plant Bio 2021 )
四倍体棉种的祖先来源及演化研究,也是一直以来的核心话题。对棉花进行驯化遗传学机理的研究,有利于野生资源种的利用及栽培品种的改良和新种质的创造。异源四倍体棉花由At亚基因组和Dt亚基因组杂交而来,包含野生陆地棉(wGh)、野生海岛棉(wGb)、毛棉(Gt)、达尔文氏棉(Gd)、黄褐棉(Gm)。野生材料经过自然选择和人工驯化,形成栽培陆地棉(cGh)和栽培海岛棉(cGb)(图4)。
图4 异源四倍体棉花进化过程
(Song Q et al., Genome Biology.2017)
朱玉贤院士团队通过高斯概率密度的全长和片段化的LTR时间评估,表明异源四倍体棉花可能在2.0 百万年前产生,A1和A2可能在0.61百万年前产生。通过染色体结构变异分析进一步说明两个A基因组是独立起源。以上结果说明异源四倍体比A1和A 2先形成,并且两种A 基因组都是独立进化的,没有祖先与后代的关系。
A1- 和A2- 基因组分支的祖先可能是一个已经灭绝的A0基因组,而A0可能是四倍体A 亚基因组的供体:A0基因组与D 5基因组杂交产生了当前的异源四倍体棉花,而随后又分化成现在的A 1和A 2基因组(图5)。
图5 异源四倍体棉花基因组的进化
(Huang G et al., Nature Genetics.2020 )
棉花有非常多的农艺性状和经济性状,例如种子含油量、纤维产量、纤维品质、抗病虫性、生理及熟性等等。棉花中已经被报道1000多个与纤维品质和产量相关的QTL位点。随着参考基因组的破译,大量棉花群体资源通过重测序等方式被完成解析。
如百迈客2018年《Nature Genetics》亚洲棉合作案例[4]:中国农业科学院棉花研究所杜雄明研究员团队联合多个研究单位,利用PacBio和Hi-C技术构建高质量亚洲棉参考基因组,并对230份亚洲棉和13份草棉群体进行了重测序和全基因组关联分析(GWAS),鉴定到与种子含油量、抗病、棉纤维发育相关的调控位点。
如百迈客2018年《Nature Genetics》陆地棉与海岛棉合作案例[5]:华中农业大学作物遗传改良国家重点实验室张献龙课题组首次通过三代测序(PacBio)+光学图谱+Hi-C技术完成了异源四倍体陆地棉和海岛棉基因组组装。构建了渐渗系群体,以导入从海岛棉到陆地棉的有利染色体片段,共计鉴定了与优质纤维质量相关的13个数量性状基因座。
如百迈客2019年《Nature Communications》陆地棉合作案例[3]:中国农业科学院棉花研究所李付广研究员团队利用了PacBio和Hi-C测序技术,组装了2个陆地棉栽培种TM-1和ZM24的基因组。通过组装完成的基因组与二倍体祖先种之间的比较,发现大量的遗传变异。并通过TM-1和ZM24杂交,构建181个RILs群体,单倍型分析显示倒位区域的重组率受到抑制。
如百迈客2019年《Plant Biotechnology Journal》澳洲棉项目案例[6]:中国农业科学院棉花研究所野生棉研究团队通过整合二代、三代及百迈客HiC技术获得了高质量的澳洲棉基因组。通过多组学发现了响应独脚金内酯、茉莉酸、水杨酸诱导的黄萎病抗性相关基因GauCCD7和GauCBP1及腺体发育相关新基因GauGRAS1。
如百迈客2020年《Nature genetics》草棉、亚洲棉和陆地棉项目案例[7]:武汉大学朱玉贤院士团队利用了北京百迈客生物技术有限公司的Hi-C技术分别将草棉和亚洲棉的95.69%及92.18%序列挂载至13条染色体上,完成了高质量棉花基因组图谱。对来自印度、巴基斯坦、中国等国家的14份非洲棉和67份亚洲棉种质资源重测序,明确非洲棉A1和亚洲棉A2基因组的遗传差异,解析棉花基因组进化起源的问题。确定了与棉花纤维长度性状相关的结构变异。
如百迈客2020年《Plant Biotechnology Journal》亚洲棉项目案例[8]:中国农业科学院棉花研究所杜雄明研究员团队联合多个研究单位,通过对215份亚洲棉自然群体的种子短绒和无茸毛性状进行全基因组关联分析(GWAS),鉴定得到位于A08染色体末端的一个长度为6.2 kb的插入片段与短绒和叶茸毛表型显著相关,并可以特异激活其下游短绒发育关键基因GaFZ的表达。共表达和互作分析显示,GaFZ基因可能通过抑制超长链脂肪酸伸长途径中的基因表达来影响短绒和叶茸毛的发育。
参考文献:
[1] 樊龙江. 植物基因组学[M].2020
[2] Wendel J et al.,Taxonomy and Evolution of the Cotton Genus, Gossypium.2015
[3] Yang Z et al., Extensive intraspecific gene order and gene structural variations in upland cotton cultivars. Nature communications. 2019
[4] Du X et al.,Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits. Nature genetics.2018
[5] Wang M et al., Reference genome sequences of two cultivated allotetraploid cottons, Gossypium hirsutum and Gossypium barbadense.Nature Genetics.2018
[6] Cai Y et al.,Genome sequencing of the Australian wild diploid species Gossypium austral highlights disease resistance and delayed gland morphogenesis.Plant Biotechnol J. 2019
[7] Huang G et al., Genome sequence of Gossypium herbaceumand genome updates of Gossypium arboreumand Gossypium hirsutumprovide insights into cotton A-genome evolution.Nature Genetics.2020
[8] Wang X et al., Large-fragment insertion activates geneGaFZ(Ga08G0121), and is associated with the fuzz and trichome reduction in cotton (Gossypium arboreum).Plant Biotechnol J.2020