书名
基因社会
作者
(美)以太·亚奈(ItaiYanai) / (美)马丁·莱凯尔(MartinLercher)
译者
尹晓虹 / 黄秋菊
豆瓣
http://douban.com/book/subject/27078158/
目录
前言
序 基因的社会规则
第一章 八步轻松演化成癌
第二章 你的对手定义了你
第三章 性有何用?
第四章 克林顿悖论
第五章 复杂社会中的随性基因
第六章 猩人的世界
第七章 关键是你怎么用
第八章 剽窃、模仿和创新之源
第九章 阴影下那不为人知的生命
第十章 注定赢不过不劳而获者
结语
致谢
拓展阅读
第九章 阴影下那不为人知的生命
我们的故事始于以下观察结果:细胞有两种完全不同的基本生活方式,要么作为一个大集体的一部分,要么独立生存。我们肠道里的细菌都是以单细胞的形式生存的:它们是群落的一部分,会和邻居合作或者产生矛盾,但是它们彼此的命运之间并没有不可分割的联系。然而人体细胞却相反,它们是一个大集体的一部分,在这个大集体里它们完全依赖于彼此:只有把你所有的细胞都加在一起,你才能成为一个独立的个体。
动物是上万亿个合作细胞组成的整体,每个细胞都参与机体的劳动分工。这种合作的组织方式千差万别:有海绵动物,有水母,有蜗牛,有蠕虫,有苍蝇,有海星,还有青蛙等。植物、真菌、很多藻类还有黏菌类也是由细胞集体构成的。尽管细菌种类数不胜数,但是没有一种细菌能通过不同个体的通力合作来建造出像动物或者植物那么复杂庞大的东西。为什么做不到呢?是什么阻碍了它们呢?
一个原因就是大小问题。多细胞生物之所以更大,不只是因为它们包含更多细胞,还因为它们的每个细胞都比细菌大,而且不只是大一点点。就体积而言,你的细胞大约比大肠杆菌大1000倍。你的细胞之所以要大这么多,是因为每个细胞都要包含全部的指示,来构建和控制你这个复杂生物体所需的特定结构。每个细胞中组装的基因组也会更大——你的基因组也比细菌基因组要大出约1000倍。许多细胞有着特定的功能,而更大的细胞体积对于这些功能来说是必需的:比如说你的大脑,它的工作原理是建立在特殊形状和尺寸的细胞之上的,而这些细胞的尺寸远远超出了细菌细胞大小所能达到的极限。这一原理同样适用于你的肌肉、血液和免疫系统中的细胞:它们的大小直接关系到它们的功能。
其实细菌无法生产出足够多的能量来运转更大的细胞。那我们为什么能做到呢?我们复杂的细胞里隐藏着一个秘密,它能解释的不只是细胞大小。我们告诉过你你的基因组有46条染色体,其实并非全然如此。我们将演化描述为一个仅仅由基因组中的突变推动的过程,其实也并非全然如此。真相其实更吸引人。这些谜团的最终答案还在于一场古老的业务合并。
王国的诞生
自1859年达尔文的《物种起源》出版以来,科学家们就想象着如何用一棵树来描述地球上的生命的历史故事。整个19世纪和20世纪,生命之树经历过多种版本,树上深深浅浅的各处分支都依然在不断更新。
1925年,巴黎路易斯巴斯德研究所(Louis Pasteur Institute)的研究员爱德华·沙东(Édouard Chatton)发现细胞分为两种:一种有细胞核,即细胞内特殊的一个空间,用来储存细胞的基因组;还有一种细胞没有细胞核。前者构成的生物体被命名为真核生物(eukaryote),这个词由希腊语中表示“真实”的单词(eu)和表示“核心”的单词(karyote)组合而成。所有的多细胞生物,包括动物、植物和真菌,都属于真核生物。
细菌细胞没有细胞核,它们的基因组直接悬浮在细胞里。由于人们认为这种细胞是更为原始的生命形式,所以用希腊语中表示“前”的前缀(pro-),把它们命名为原核生物(prokaryote)。
但是要怎样才能建立一棵家谱树,将人类和细菌这样完全不同的生物都包括进去?在达尔文的《物种起源》出版后的头一百年中,演化树的建立基于的都是物种的可见特征。要想建立一棵鸟类的演化树,首先得查看鸟的身体长度、外形、鸟喙颜色。
关于如何解读身体特征变化的科学争论一直甚嚣尘上,从而引发如何判断物种之间真正亲缘关系的争论。如果没有客观的标准,我们无力化解这些争论。当我们有了识别DNA字母序列的能力后,我们便彻底地改变了这一挑战。
通过这些比较DNA的方法,我们可以为某个存在于所有目标物种内的代表性基因重建一棵完整的演化树。
20世纪70年代后期,卡尔·乌斯(Carl Woese)和乔治·福克斯(George Fox)用这种方法建立了第一棵全面的进化树。他们发现的结果震惊了世界:组成细胞生物的并不是沙东假设的两个类别,即真核生物(包括多细胞生物)和原核生物(细菌),而是三个类别!一类是细菌,包括我们的朋友大肠杆菌,它显然是有别于真核生物的。但是让人吃惊的是,乌斯和福克斯发现真核生物这一支里还有一类细菌,这两种细菌是完全不同的生物,就像人类和细菌那样相距甚远。看上去和真核生物亲缘关系更加密切的那类细菌被命名为古细菌(archaebacteria),另一类细菌被重新命名为真细菌(eubacteria,意为“真正的细菌”)。乌斯和福克斯仅仅通过比较DNA中的字母就发现了一片全新的生命领域。
古细菌生活在极端环境中。它们居住的都是世界上环境最恶劣的地方,比如说接近沸点的热泉里、碱性和酸性的水体中、奶牛的消化道里,以及海底,有些古细菌甚至以石油为食。
在乌斯和福克斯的生命之树上,真核生物分支从古细菌谱系那里开始分叉。
一棵基于分解酒精的基因的生命之树显示人类和其他真核生物源自真细菌,而不是古细菌。
哪一种生命之树是对的呢?有充分证据表明其实这两种都是对的。这样一来就更有意思了。两棵树都准确地描述了它所基于的基因的演化史,但是两棵树又都不是真核生物基因社会演化史的代表。
我们在第八章已经讨论过细菌之间的水平基因转移,我们发现单个基因有可能是带着自身演化历史进入基因社会的移民,因而并不一定代表整个基因社会的演化史。对于基于单个基因的演化树的争议可能只是反映出一个事实:单个基因的演化历史中的不同部分有可能是在不同的基因社会中度过的。
如果无法战胜他们,那就加入他们
能量需求是随着体积变化的,而能量生产却受到细胞表面积的限制,因此能量生产的增长速度远远低于能量需求的增长速度。一旦细胞大小超过一定规模——这一规模远远小于你的细胞——真细菌和原始细菌便无法继续满足它们自身的能量需求。
那么我们的祖先是如何解决这个看似无法克服的问题的呢?组成大脑的细胞那么大,又是如何维持的呢?限制细菌大小的原则在你自己的细胞中同样适用:要提供它们所需的能量,需要比它们表面积更大的膜。这片隐藏在阴影中的面积就是多细胞生物里的欧文。
你和细菌之间一大关键的区别就是你的细胞不用它们的外膜来提供能量。你的细胞用的是细胞内部一种名为线粒体(mitochondria)的特殊结构的表面。线粒体是一种存在于所有真核生物细胞里的专门区室或“作坊”。每个真核细胞都有很多线粒体,它是我们的细胞发电厂。
你细胞里所有不同区室的建造和工作全都是由你46条染色体上的基因规定好的,但是线粒体除外。每个线粒体都有自己的小基因组。线粒体染色体和你其他染色体的结构不一样——线粒体染色体是圆形的,就像细菌中常见的染色体。
这种细胞里部分独立的结构是如何演化的呢?1970年,生物学家林恩·马古利斯(Lynn Margulis)提出了一个大胆的理论。她提出,线粒体曾经是一种独立的真细菌。在某个时候,一个早期的真核细胞吞下了一个真细菌,但是它并没有将之消化,相反,真核细胞允许真细菌在其细胞里生存、分裂、繁衍。寄主真核细胞的后裔和真细菌的后裔从此过上了幸福的共生(symbiosis)生活。
大约20年后,比尔·马丁(Bill Martin)和米克洛什·米勒(Miklós Müller)提出了对于马古利斯理论的新解读。当时,大多数专家都假设获得了线粒体的细胞是一种早期的真核细胞,尽管如今并没有这种原始真核细胞存在的痕迹。马丁和米勒则提出这一始祖一定是一个古细菌。大约20亿年前,这个古细菌为细胞增大的能量问题找到一个机智的解决办法:它吞食了一个小真细菌,并将其变为能量源。
本书中将基因描绘成自然选择的对象,但其实是过度简单化了,以便帮助读者建立起系统性的认识。人类的语言和思维需要我们将一个多样程度和复杂程度都超出想象的世界转化为100多万字和一套有限的概念。关于自然选择,更精确的说法是,演化的对象得满足自然选择的三个要求:变异、可遗传性和对适合度的影响。线粒体起源之初,自然选择的对象是一个居住于古细菌里的完整的真细菌。
一旦一个细胞吞食了另一个细胞,它们就拥有两个完整的基因组。将古细菌想象成房东,真细菌想象成房客。房客开始慢慢地失去一些基因,一些它放弃自己的生命独立性之后便不再需要了的基因,和其他基因一样,这些基因有时会自然而然地发生基因突变。
在成为合作伙伴之前,房东和房客这两个细胞也许曾是竞争者。合并在一起对双方而言都大有裨益。合并使得它们共同的后代发展成为今天地球上令人叹为观止的多细胞生命形式。但是你没有必要因为已经有合作伙伴就停止寻找新的搭档。如果你想要向你未涉足过的领域拓展业务来获利,同时有一个公司很擅长这方面,那么进行业务拓展的一个方式就是收购这个公司并将它整合到自己的公司里。所有植物和藻类的祖先正是这么做的。一个早期真核细胞吞食了一个蓝细菌(cyanobacterium),通过蓝细菌的能力,利用阳光中的能量将二氧化碳转化成糖类。直到今天,这份工作仍然由第二种房客——植物和藻类的叶绿体(chloroplast)完成。
原核生物万岁
一些生物学家认为,将真细菌和古细菌合并在一起组成为一个类别,统称为原核生物,是一种禁忌。他们认为,不仅因为这两个类别是八竿子打不着的远亲,而且将它们混合在一起就好像将你的兄弟和堂兄弟归为亲戚,却没你什么事儿,这不合常理。乌斯和福克斯的生命之树表明,古细菌与真核生物之间的亲缘关系(它们是“兄弟”)比古细菌与真细菌之间的亲缘关系更近,那么将古细菌与相距更远的真细菌(古细菌的“堂兄弟”)放一起是毫无道理的。
这种观点忽略了一个重要的方面:生命世界最大的分化将融合了的细胞(即真核生物,也包括你)从非融合的细胞(即原核生物)中分裂出来。换一种说法就是:原核生物是普通的生命形式,它恰好分为两支,即古细菌和真细菌,这两支后来奇迹般地融合了,这种融合即为真核生物。
要想恰好发生这一切,并演化形成多姿多彩的生命形式,如动物、植物和真菌,你需要一点不同寻常之处。你需要一种特殊的合作,一种与古老对手之间的合作。原始细菌和真细菌之间这种亲密关系的发展对真核生物的演化起着决定性作用。这就是我们成功的秘诀。
第十章 注定赢不过不劳而获者
人类基因社会最古老最早合作的基因中有一些要追溯到我们的真细菌始祖,其余的这些基因则要追溯到古细菌。每个基因都必须为构建或者运行人体这个生存机器做贡献,体现其存在价值。这至少是本书目前为止所讲述的所有内容的前提。但是为集体做贡献并不是基因生存的唯一策略。
如果我们找出每个对集体有用的基因,包括管理所有基因的开关,计算一下这些基因所对应的DNA字母数目,就会发现这一数目加起来不到基因组的三分之一。人体DNA里有一大部分基因并不参与维持基因社会。那些对集体有用的基因里不仅包括本书一直讨论的重点——20000个蛋白质编码基因,还包括人们认为对人类适合度有贡献的其他基因区域。如果剩下的基因对人体健康和成功繁衍没有作用的话,那么这占据人类基因组绝大多数的40亿字母是做什么的呢?它们为何存在呢?
要回答这个问题,我们要先看看这些占基因组绝大部分的序列。你基因组里不下15%的基因对应一个特殊的字母序列,并复制出了50万份拷贝。要想全面地看待这一现象,先想象一下你去纽约公共图书馆,发现120万本藏书中,有18万其实是一样的。多浪费书架啊!你基因组里那50万个拷贝并不完全一样,有些有99%的字母是一样的,有些差距稍大。
前面在讨论DNA字母序列的相似性的时候,我们将之看作是拥有共同祖先的信号,一个人头发的颜色和鼻子的形状可能表明他的血统。这里也一样:这50万份拷贝如此相似,只能说明它们源自同一个祖先。所有这些元件都能追根溯源到一个模板序列,这个模板早在几百万年以前在我们某个灵长类祖先的基因社会里就已经存在了。
因此,你基因组里面的这些拷贝组成了一个大家族,然后分化成小家庭,每一个拷贝都是由之前的拷贝倍增而来。这和我们前面讨论过的基因重复一样,尽管其倍增的具体机制略有不同。每个拷贝的变异都来自基因突变的累积:每个拷贝可能会有一些细微的改变,然后又遗传到后来的新拷贝里。
底线
这些序列被称为LINE1(long interspersed element type 1,长散在核元件1)。它们是基因,但是是特殊的基因。每个完整的LINE1都有6000个字母那么长。也有许多缩短的副本,它们只保存了末端。LINE1的字母序列并不是随机的:一个完整的LINE1序列控制着三种简单的功能,这三种功能组合在一起能实施一个有效的程序,包括管理RNA-DNA转换器和切断DNA。
尽管LINE1对基因社会的成功并没有任何贡献,但是它们也有自己的功能——一种保证自己生存的功能。如果一个基因社会只有一个LINE1,一旦这个LINE1由于基因突变而失活,那么它命不久矣。
但是如果一个基因社会里有很多活跃的LINE1拷贝,那它们就不可能会被偶然的突变清除出局。哪怕基因突变使一个LINE1衰弱了,新的LINE1通过复制/粘贴机制又诞生了。只要LINE1倍增的速度快于清除的速度,LINE1家族就不会衰亡。根据人类基因组现有的50万个LINE1拷贝来看,LINE1的倍增速度的确非常快。
为什么基因社会会容忍这么猖獗的复制呢?LINE1不劳而获,给基因社会增加了负担。LINE1不只转移了读取DNA和生产蛋白质的细胞机器的注意力,使其转而满足LINE1自私的目的,还占据了每次细胞分裂都要维持和复制的基因组空间。不过对于现代人及其祖先来说,这一负担显然并没有大到让整个基因社会崩溃的程度,所以LINE1代代相传。如果这个负担过大,那么携带大量LINE1的个体的后代就会更少,LINE1的数量也就会减少。
所有基因都对它们构建的生物个体毫不留恋,全部遗传到下一代。但是普通基因对于它们之间的合作却相当依赖。我们看到,基因能够构建一整个生物体并凭此遗传到下一代的唯一方式就是相互合作,没有一个基因能独自完成这个任务。
资本主义社会运行方式和这个类似:在公平的规则内,可以自私,通过这种方式,每个个体都为整体利益最大化做出了贡献。通过为集体做贡献,普通基因能确保它在基因社会里的生存地位,因为一旦失去它,整个基因社会都会遭受损失。
尽管所有基因可能都有一个自私的动机,即让自己成功遗传到下一代,但是LINE1是一个特例:它们纯粹就是来不劳而获的。它们的谋生之道不是让自己成为有用之才,而是让自己在基因组里的扩增速度大于被除去的速度。由于这种策略行之有效,它们没有必要以其他的方式为自己的存在找理由。只要它们坚持不懈,它们不必为所在的个体做贡献。
记得吗,你的基因组里只有30%的基因是有用的基因。剩下的70%里,LINE1占了不到1/4。那剩下的基因组是怎么回事?其中一部分其实是被另一个不劳而获的家族——Alu家族占据了。你的基因组里有整整100万份该家族基因的拷贝。每个Alu大约有100~400个DNA字母那么长。它们的数量比LINE1多,但是长度比LINE1短。
Alu并不是独一无二的揩油大师。如果一个基因社会成员发现了这个系统的空子,别的成员怎么可能不学呢?和Alu搭LINE1的顺风车一样,另一个名为MIR的不劳而获家族利用另一个LINE家族(LINE2)来制造拷贝。所有SINE和LINE家族加在一起占了人类基因组的整整1/3,是基因组里有用基因的数目大1万倍。基因组里不劳而获的基因还不止于此。还有其他不劳而获的家族,每个都是通过搭顺风车的方式利用基因社会并遗传到下一代,但是却不为这个社会做贡献。
尽管我们基因组2/3的地盘被不劳而获者占领,但是和其他物种比起来,我们还算幸运的。一个普通洋葱的基因组里满满地挤着近300亿个字母,是我们基因组字母的5倍;有些变形虫的基因组是人类基因组大小的百倍。这些为数众多的DNA字母里,大部分是不劳而获的基因,就像人类基因组里的LINE和SINE一样。基因组能够容忍的不劳而获者数量取决于该生物的生活方式。
那我们和洋葱还有变形虫之间的共同点是什么呢?我们基因组里不断积累起来的这些垃圾其实只表明,在演化史上,我们大多数时候都是生活在聚居的小群体中的。在小群体里,自然选择的效率稍有下降,概率的作用更大。因此,在基因社会中,给携带者小小地增加了一些负担的自私成员其存活的概率更高。从某种程度上讲,我们基因组的大小反映了一个事实,即直到几千年以前,人类一直是以小群体聚居的形式生活的。
LINE1 DNA断裂器对你染色体的切割多少是有些随机成分的,但是LINE1和Alu的重复拷贝并不是平均分布在你的整个基因组里的。例如,我们在第七章讨论过,基因组里有一片区域包含一个大的同源异形基因簇,它们负责在胚胎发育阶段建立形体构型。这个区域就完全没有不劳而获的基因。
难道不劳而获者知道打扰这里的基因就会摧毁它们赖以生存的生物体,因此有意对这片区域敬而远之吗?这是不可能的。不劳而获者是不折不扣的骗子,它们不会放过任何区域,就像随机突变改变字母时不会有任何偏向性一样。但是在其他突变中,负选择发挥了作用。
一个不劳而获的基因会尝试几百万次试图将它的拷贝插入到一个同源异形基因里,只要有一次成功,就会导致基因组无法构建一个功能正常的生物体。在同源异形基因簇中插入基因会是给整个基因组带来灾难,指望着搭顺风车的新不劳而获基因拷贝一样无法逃脱这场灾难。
圣马可的拱肩
但是不劳而获的基因对基因社会而言真的没有任何好处吗?难道LINE1和Alu臭名昭著的出身让它们连偶尔起点作用都不可以吗?由于自然选择会把握住对适合度有益的变异,因此你基因组里数不胜数的不劳而获者似乎不大可能一点作用都没有。
的确,我们在越来越多的单个不劳而获基因中发现了它们的有用之处。它们有些能通过将自身插入基因组使得基因扩展,从而促进了基因的演化。在另一些情况下,一些不劳而获者元件插入到了基因的调控区域,从而改变了该基因的管理者用于开启和关闭该基因的分子开关,于是,该基因被读取的时间可能会因此发生改变。在极个别情况下,这种不劳而获的元件会使该基因对其携带者的适合度贡献作用更大,这种特殊的不劳而获者本身也会成为基因社会的有用成员。还有时候,一个不劳而获的元件插入了基因组,其“请读我”信号可能会帮助一个新基因吸引聚合酶机器,如此一来,这个不劳而获的元件也会变成有用成员。
由于大多数不劳而获者不会给有机体带来任何益处,因此它们一直存在的最好的解释就是:不是因为它们认真履行自己的职责,而是因为它们善于复制自己。就像克雷默一样,它们都是来蹭吃蹭喝的,哪怕有的时候它们的行为会给机体带来好处也无法改变这一事实。不劳而获者不断整合到基因组里,使基因社会里出现一连串的新变异。由于变异这么多,总会有些时候,有那么一个不劳而获者带来的变异是有用的。
许多生物学家仍然迫切地想为不劳而获的基因找个功能。这与其说是在研究生物学原理,还不如说是在揭示心理学现象。也许我们更愿意相信我们基因社会的演化是高效而有序的,而不是像本章中所描述的那样杂乱无章,到处是无用的基因。
每一份好的科学报告都会讲述一个扣人心弦的故事,在所有关于LINE或SINE家族的报告中,故事线都是这样的:我们以为所有的LINE(或者SINE)都是白吃白喝的无用元件,但结果我们发现有些拷贝有助于提高机体的性能。这显然是一个引人入胜的故事,但是如果暗示所有白吃白喝的基因都是有用的,那便是误导了。
有一个先入之见认为,生物的一切都有某种适应性优势。史蒂芬·J.古尔德试图揭穿这一成见。他认为一个结构可能保有对自身而言毫无用处的特点,或者说,这些特点反映了某种特定的限制条件。
古尔德用了一个建筑图案——拱肩来阐释这个观点。拱肩是两个拱形之间或者一个拱形与一个长方形之间的三角形部分。许多教堂,比如威尼斯的圣马可教堂,通常会用大量装饰图案盖住这些拱肩。当然,为这些装饰腾出空间并不是这些拱肩的初衷——它只是结构限制的结果,后来扩展适应发展出了装饰功能。同样,我们基因社会的不劳而获者也是自然选择在基因组中留下的一个现象。其中有一些可能扩展适应出新功能,但那并不能否认它们最初纯粹只是不劳而获者这个事实。
生命最古老的敌人
SINE和LINE让我们瞥见了无处不在的不劳而获者是如何生存的。不劳而获者利用基因社会的方法可能会让你想起来我们在第二章讨论的病毒。病毒是不劳而获界的鼻祖,它在我们熟悉的细胞生命之外创造了一个巨大且出奇复杂的阴影世界。事实上,病毒世界极为庞大。倘若将地球上所有的基因组加在一起,病毒基因组要占据其中的绝大多数。尽管病毒基因组很小,但是数量是所有其他基因组总和的9倍。
虽然细胞生命的形式多姿多彩、数不胜数,但是病毒的种类比细胞生命还要令人目不暇接。关于这方面有个有趣的例子,那就是病毒基因组中多种多样的数据储存系统。所有的细胞生命都是以双链DNA螺旋的形式来储存基因组信息的。原则上来讲,同样的信息也可以单链DNA、单链RNA或者双链RNA的形式来储存,但是动物、植物、真菌和细菌都选择了使用双链DNA。所有的细胞生命形式都只是将RNA用作临时用途,或是当成信使,或是行使细胞内的某种特定功能。但是在病毒世界却不是这样的,病毒启用了所有可能的基因储存系统。有些病毒使用双链DNA,有些使用非配对的单链DNA,还有一些使用双链或者单链RNA。如果再算上从单链DNA或者RNA上读取基因信息的不同方法,那么病毒一共有7种完全不同的基因储存系统。
病毒有几百万种不同的形状和大小,如此丰富的多样性在细胞生命中是前所未见的。最惊人的是,这么多病毒竟然连一个共同基因都没有。这和细胞生命又形成了鲜明的对比。大约有50个基因是所有细胞所共有的,这些基因编码了打开DNA的机器、解读DNA的聚合酶、生产蛋白质的核糖体,这些都是所有细胞生命形式的基因社会都拥有的成员。
为什么在病毒里不是这样的呢?比如为什么没有一种为病毒的蛋白质外壳编码的通用病毒基因呢?不仅不同的病毒制作外壳的方式不一样,有些病毒甚至根本不需要编码外壳的基因。这些病毒占不劳而获者的便宜,它们不仅是人类细胞的寄生虫,还是它们病毒近亲的寄生虫。它们和近亲病毒一起入侵细胞,骗取其近亲生产外壳蛋白质的指示来生产自己的外壳,就像Alu占LINE1的便宜一样。每种病毒的基因之所以各不相同,可能是因为它们不劳而获的天性——原则上来讲,它们可以利用受害者的基因来完成每个核心功能,自己也就不需要拥有行使核心功能的通用基因了。
据我们所知,所有的细胞生命都源自同一先祖基因社会。一个有力的佐证就是有大约50个基因是所有的细胞生命形式所共有的。那病毒是怎么回事呢?它们是否也源自同一病毒祖先呢?而且,是先有病毒还是先有细胞呢?由于病毒依靠我们的蛋白质生存,我们很难想象一个只有病毒的世界。但是有证据表明,也不是先有细胞。其实很有可能,在生命的初始,细胞和病毒有着共同的起源,而两者间史诗般的战役从那时起就开始了。
入门生物学
我们如今所知的生命是复杂的,但是最初的生命一定是非常简单的,否则它当初不可能出现。在今天的细胞里,DNA和RNA储存信息,同时蛋白质负责细胞内部大多数的分子功能。这些分子中,哪种是最先演化出来的呢?是使信息能够传给下一代的DNA,还是加工这些信息的蛋白质?这是否是一个经典的鸡与蛋的问题呢?我们并不知道确切的答案。
关于这些问题,有很多彼此矛盾的学说,目前仍是众说纷纭,莫衷一是。由于我们现在是在讨论40亿年前某个未知的地方发生的事,我们可能永远都无法百分之百确定。不过,为了了解生命是如何演化的,我们来看看我们目前能够得出的最佳推测。
由于RNA字母A和U(后者对应DNA里面的T)以及字母G和C倾向于结合在一起,RNA字母的序列能够对自身进行折叠。通过这些折叠,一个RNA分子呈现出一个由字母序列编码的三维形状,就像组成蛋白质的氨基酸链能够自发折叠成其蛋白质结构一样。根据折叠后RNA的具体形状,其产生的分子可以变成一个小型分子机器,就像促进特定化学反应的酶一样。所以说,今天蛋白质的很多功能原则上来讲是可以由RNA分子完成的。核糖体是如今的生物里的蛋白质生产机器,它的一大部分也是由RNA组成的。
因此,RNA能同时既编码可遗传信息,又充当分子机器。这种双重身份使一条RNA有可能(至少从理论上讲有可能)既携带可遗传信息同时也催化自身的复制。所以,最初编码基因信息的分子和执行功能的分子之间也许并没有明显的区别。在DNA、蛋白质和细胞壁出现之前,一个“生命”世界可能完全由RNA构成。
这些RNA复制因子可能是在哪儿演化的呢?生命是需要能量来源的,所有能用以维持生命的能量最终只来自两处:太阳光线(可通过植物、藻类和一些细菌的光合作用被利用)或者是地热过程产生的化学能。光合作用需要一个复杂而特化的机器,所以不可能成为早期生命的支撑。不过,在大洋底部,海底热泉喷发出高温且蕴含丰富化学物质的液体,这些液体与冰冷的海水混合,这个过程中发生的化学反应和当今生命形式中心代谢过程的某些重要部分很相像。
细胞的能量生产需要一层两边质子浓度不同的薄膜,这就是为什么动植物需要线粒体来支撑它们丰富多彩的生命形式(参见第九章)。但是在由深海热泉自然形成的质子浓度差也有同样的功效。因此,生命似乎很有可能始于海底热泉周围岩石上的孔洞里。我们可以想象第一批RNA分子自发地聚在一起,在这个化学成分丰富的环境里形成了早期的原始基因社会。只要有足够长的时间,就可能会出现第一个RNA复制因子。它一旦出现,就会不断进行自我复制。
在这种最早期的基因社会里,不劳而获者肯定极为猖獗。第一批能对它们自己进行复制的RNA分子很可能无法分辨自己的同类和其他RNA序列。因此,它们不仅对同类进行了复制,还复制了它们遇到的别的RNA。
不劳而获的RNA随着复制因子的增加而不断扩增,这给复制因子造成了很大的压力。这些不劳而获者成了第一批类病毒,也就是后来的病毒的先驱。为了甩掉多余的负担,复制因子就得让那些不劳而获者离自己远点。
有一个复制因子设法用生物膜将自己围了起来,这样既能让食物进来,又能隔离不劳而获者。和它那些仍被不劳而获者困扰的同伴相比,它获得了很大的优势。这样发明出来的细胞膜有一个有趣的副作用:它使其携带者能够在保持自身完整性的情况下离开岩石孔洞。细胞膜形成了一个容器,使里面的基因社会可以走出岩洞,到周边的海洋甚至更远的地方去闯荡。剩下的就是大自然的演化史了。
结语
本书也是一本长篇的论争,展现了将一个物种的基因构成视作一个基因社会这一观点的强大解释力。正如道金斯的“自私的基因”理论,我们也将基因视为自然选择的影响对象。然而,我们将重点转移到了基因间的关系上,即基因在运转它们的生存机器——即我们人类时,彼此间的合作和竞争。
当我们的基因编码人体机能,比如减数分裂或人体防御系统时,基因之间会形成联盟。基因构成了一张错综复杂的关系网,每个基因在其中均可支持多项人体机能。尽管基因社会的演化常常不过是来自无处不在的随机性,但基因社会不会停滞不前。
当基因社会中的某部分与其主体分离开足够长的时间后,这种不断的变化会使分离出的部分形成新的基因社会——即新物种的分化。但在极少数情况下,基因社会也会融合,于是其复杂程度再创新高。当新成员通过复制加入基因社会或者从其他基因社会迁入时,变化也会随之产生。基因可以利用多种有效的相互作用手段得以继续存活,其中对基因增殖最有利的手段就是不劳而获。在整本书中,我们重点解释了基因社会中的相互作用是如何影响单个基因的成功生存的,即从“经济的”角度来看待基因社会。但与此同时,我们也强调了历史视角下的基因社会。现存的生物是经历了长久的演化而来的。或者,正如从物理学改行的生物学家马克斯·德尔布吕克(Max Delbrück)所说:“任一细胞所代表的事物并非仅仅是物质性的,而是历史性的……每个存活的细胞所承载的是其祖先十亿年来摸索得出的经验。”