作者:Marc Somssich, University of Melbourne
编译:曹务强,中科院遗传发育所
我们都知道,无论是植物、动物、微生物还是人类,基本上每个基因都有属于自己特异的启动子。简单来说,启动子就是位于基因上游的一段DNA序列,它可以调控基因的表达。不同的启动子具有不同的活性,特异调控基因在何时、何地以及以多少量表达。在“植物启动子圈儿”有一位明星级别的启动子几乎无人不知,那就是35S启动子。有意思的是,这个在植物生物技术中广泛应用的启动子的“出身”并不好,它并没有正统高贵的植物家族血统,却来自于一种臭名昭著的植物病毒。你一定很好奇,这种戏剧性的大逆转是如何发生的呢?接下来,就让我们一起来回顾一下这段让人惊奇而又有趣的历史吧。
花叶病毒(1921-1937)
严格来说,35S启动子应该叫做CaMV 35S启动子。CaMV是Cauliflower Mosaic Virus的缩写,翻译成中文是花椰菜花叶病毒。有趣的是,CaMV最早并不是在花椰菜中发现的,而是于1921年首先在大白菜(Chinese cabbage)上发现。感染了这种病毒的植物叶片表面出现类似马赛克的坏死斑痕,因此被称为花叶病毒(Mosaic Disease)。在接下来的几年里,这种病毒也逐渐在大头菜(turnip)和雪菜(pot-herb mustard)上发现。可是,当时并没有引起人们太大的关注。直到十几年后,美国中西部地区圆白菜(cabbage)农田中蚜虫肆虐,导致CaMV的大爆发,对农业生产造成了重大损失。与此同时,美国加州的花椰菜上也发现了类似的马赛克坏死斑。而直到此时,CaMV才开始引起科学家们的注意,他们从此才开始投入更多的时间和精力,去研究这位造成重大农业生产巨大损失背后的凶手。
1937年的一项研究表明,被CaMV感染的花椰菜可以把病毒传染给51种不同的蔬菜类植物,比如西蓝花( broccoli)、卷心菜( cabbage)、羽衣甘蓝(kale)、大头菜( turnip)、甘蓝(kohlrabi )以及大白菜( Chinese cabbage)。有意思的是,这些植物全都属于十字花科。另外,研究人员还发现了至少三种以花椰菜为食的蚜虫,可作为CaMV的传播媒介。由于这一开创性的研究以花椰菜中的mosaic virus为研究对象,于是从此开始,这种病毒就逐渐以Cauliflower Mosaic Virus的名字被大家所接受。
花椰菜花叶病毒(1937-1978)
在1940s晚期,对于CaMV的研究在欧洲达到了一个高潮。在当时,由于受CaMV的影响,英国的花椰菜和西蓝花生产损失惨重。而此时第二次世界大战才刚刚结束,食物短缺,CaMV的爆发无疑是雪上加霜。科学家们立刻对CaMV启动了紧急研究,很快取得了重大进展。他们发现CaMV是一种非循环(non-circulative)非持久(non-persistent)的病毒,也就是说,它们并不会进入昆虫媒介体内,而只是进入蚜虫的口针中,并通过蚜虫的刺吸在植物间传染。有意思的是,后来2007年的一项研究表明,CaMV只存在于蚜虫口针远端的一个大概长为5μM宽为1μM的区域。
1960s的一项研究发现,CaMV是第一个被鉴定的双链DNA植物病毒。这具有非常重要的意义,因为这是病毒DNA可以在植物细胞中成功转录的先决条件。另外,这也是CaMV作为副反转录病毒(pararetrovirus,相对于大家所熟知的单链RNA反转录病毒而言)的第一个证据。1980年,CaMV的基因组公布,它是一个8024bp的双链环状DNA分子,预测有6个ORF。从此往后,科学家们才逐渐得以从分子水平解开CaMV侵染植物的秘密。
在1980s早期,科研人员发现,预测的6个编码区只被转录成2个mRNA,一个是比较短的单顺反子19S RNA,另一个是覆盖全基因组的35S mRNA。虽然19S RNA只编码一个蛋白,但是后来的研究发现,它在抑制宿主植物细胞中的基因沉默过程中发挥了重要作用。35S mRNA是基因组复制的模板,它还可以进一步分割为4个独立的mRNA。
35S RNA有两个非常奇怪的特点:(1)虽然它是基因组复制的模板,但它却比基因组要长,因为在它的5'端和3'端有200bp的重叠;(2)它有一个不太常见的长达600nt的前导序列,可以被转录成大量的21到24nt的正义和反义RNA,在侵染过程中作为诱饵,吸引宿主细胞沉默系统的注意力,使真正的35S mRNA顺利逃脱。
不过,这一时期最重要的研究进展是发现了19S以及35S mRNA可以在宿主细胞中高丰度表达,这暗示着该病毒可能将它自己的双链DNA插入了植物细胞中,并且这一段插入的病毒DNA包含了在宿主细胞中高峰度起始转录的所有因子。
当花椰菜花叶病毒遇上植物生物技术(1978-1985)
在1970s到1980s早期,植物分子生物学和遗传学/基因组学正处于发展初期。在这一阶段,拟南芥才刚刚作为一种模式生物被正式接受,植物的遗传转化体系还没有建立,只有极少数的基因被克隆和研究。其中,只有一种可以在植物中发挥作用的启动子研究的比较透彻,就是细菌的章鱼碱合酶(octopine synthase )基因启动子。另外,还有一种来自于豌豆的核酮糖-1,5-二磷酸羧酶(Ribulose-1,5-bisphosphate carboxylase)基因启动子被做了大概的定位。
因此,当科学家们逐渐发现CaMV可以将它们的DNA插入到植物细胞中,并可保持高丰度表达后,他们马上意识到了CaMV作为遗传转化克隆载体特异表达目的基因的潜力。从此开始,对于CaMV的研究主要分为两大派系:第一派主要研究将外源基因插入到CaMV基因组中后,到底是否能够插入植物细胞,并在宿主细胞中成功表达;第二派试图寻找决定CaMV基因在植物细胞中高丰度表达的特定DNA序列。
第一派的科研人员很快就取得了重大进展,他们将细菌和哺乳动物的基因克隆至CaMV的基因组中,证明了这些基因可以成功地插入植物细胞并表达。不过同时,他们也发现了这一体系具有严重的先天缺点:CaMV只能成功导入小于250 bp的片段,对于大片段却无能为力,这就严重限制了CaMV遗传转化体系的发展和应用。而后来,科学家们建立了更加有效的农杆菌转化法,CaMV介导的植物转化在1990s早期逐渐凋亡。不过,相对于第一派的逐渐凋零的结局,第二派的研究就是非常成功了。
CaMV 35S启动子(1985-2000)
我们现在要研究基因的功能,常用的一个手段就是将基因过表达,观察转基因植株的表型有什么变化。可是在1985年以前,由于转基因体系还没有建立,以上这都无法实现。CaMV 35S启动子的发现,为植物遗传转化体系的建立带来了一线曙光。
为了揭示控制病毒基因在植物细胞中表达的特定序列,科研人员将35S基因启动子区域1000bp左右的序列进行了不同的删除,并将它们和人类的hgh(human growth hormone)基因融合,使用农杆菌转化到植物细胞中。他们发现,35S基因上游的46bp序列可导致最低的表达,而另外一个343bp的序列却可导致基因在所有检测的植株组织中都有非常高的表达。于是,这段343bp的序列被命名为“CaMV 35S 启动子”,而那46bp的序列则被称为“最小启动子”。科研人员在后续的研究中还发现,这段343bp序列的功能竟然还有不同的分化,它们分别调控基因在不同组织中的表达,并且它们的功能还可以进行不同的组合和叠加。
基于这些开创性的发现,在随后的几年里,逐渐出现了许多其他版本的启动子,比如将两个CaMV 35S启动子串联起来会极大地增加基因的表达。另外,46bp的最小启动子也是一个非常有用的工具。后来,科研人员发现,不同基因启动子区域中小的调控序列可以被特定的转录激活因子结合。受此启发,科学家们将不同激活因子和最小启动子结合,发明了使用特异的激活因子激活基因表达的启动子,这就是我们熟悉的诱导型表达启动子。使用这种诱导型表达启动子,可以使我们任意操控基因的表达时期,这在基因功能的研究中具有非常重要的意义。
仅仅在35S启动子发表后的一年(1986年),研究人员就将35S启动子驱动的EPSP( 5-enolpyruvylshikimate-3-phosphate synthase)基因转化到矮牵牛中。EPSP基因是芳香族氨基酸合成通路中非常关键的一个酶,另外它还是除草剂特异的靶标。人们惊奇的发现,过表达EPSP基因的转基因植株竟然有了除草剂的抗性,这就是人类历史上第一个抗除草剂转基因植物。
值得注意的是,35S启动子的发现,农杆菌介导的植物转化体系的建立,以及抗除草剂转基因植物的出现,这三大植物学历史中里程碑式的研究成果仅仅在三年的时间里接连发表,这是植物科学共同体以及正处于快速发展阶段的植物生物技术领域的巨大飞越。在接下来的二三十年中,35S启动子成为了植物生物技术领域使用做广泛的启动子,并且我们现在种植的所有转基因植物几乎都含有35S启动子。
当今的CaMV 35S启动子(2000-今)
时至今日,35S启动子已然成为植物科学中使用最广泛的启动子。不过,由于一些原因,现在35S启动子的使用却正慢慢减少。其中,最主要的原因就是,相对于1980s年代,我们现在除了35S启动子还多了一些其他的选择。拟南芥的UBIQUITIN10(UBQ10)启动子在1990s中期被发现,它也是一种非常强的启动子,并在所有组织中都具有非常高的活性。作为一种具有植物家族出身的启动子,UBQ10正在越来越多地替代35S启动子的使用。而科研工作者们也逐渐发现,实际上35S启动子并不是在所有的组织和细胞中都有活性,而UBQ1或10并没有这种缺陷。其次,2000年拟南芥基因组组装和注释的完成,使人们对拟南芥基因组中所有基因及其调控序列有了比较清楚的了解。科学家们可以比较容易地克隆基因,并使用基因内源的启动子或者组织和细胞特异的启动子研究基因的功能。再次,矮牵牛花田间试验中出现的基因沉默现象,启发科学家们将35S启动子和p19沉默抑制子连接在一起使用。虽然这可以在一定程度上抑制基因沉默现象的发生,但也使35S启动子的使用更加复杂。最后,有研究表明35S启动子不仅可以调控其驱动基因的表达,还会影响临近基因的表达,这就进一步限制了35S启动子的使用。因此,虽然现在35S启动子仍然在科学研究中广泛使用,但是越来越多的人更喜欢使用内源启动子和UBQ10启动子。
在农业生产中,批准种植的转基因作物中超过80%都含有35S启动子,比如抗除草剂大豆,转Bt基因的玉米和棉花,以及抗木瓜环斑病毒的转基因木瓜。科学研究已经证明这些转基因作物是安全的,并且人类和牲畜已经食用了数十年,并没有出现食品安全事件。由于转基因作物的培育、田间试验、安全性检测以及政府的审批极为繁琐,需要花费大量的时间和金钱,因此在实际的生产中要迁移到使用其他启动子是一项长期的工程。
不过,在实际生产中,由于专利的问题,35S启动子的使用仍有诸多限制。这就迫使人们逐渐开始使用其他类似的启动子,比如玄参花叶病毒35S启动子(FMV 35S,figwort mosaic virus 34S promoter )。另外,在单子叶植物,比如水稻和玉米中,35S启动子的活性并不如在双子叶植物中那么强,于是研究人员逐渐越来越多地使用水稻actin1或者玉米Ubi1 启动子。所以,虽然农业生产中由35S启动子向其他启动子转移的速度比科学研究中慢了许多,但是启动子的多样化正在逐渐增加。
时至今日,虽然35S启动子的使用正在逐渐减少,但是它曾经对整个植物科学以及植物生物技术领域巨大的推动作用是毋庸置疑的。
相信真到了盖棺定论的那一天,35S启动子必将在植物科学史中留下浓墨重彩的一笔!
注:版权归原作所有。本编译版本根据原文完成,为增强可读性并非原文逐字翻译。原文信息如下:
Somssich, M. (2018). A short history of the CaMV 35S promoter. PeerJ Preprints.
DOI:10.7287/peerj.preprints.27096v2