地球上的生物有170多万种,可以分为各种类型的生物。从细胞的结构特点,可以分为原核生物(prokaruotes,即没有细胞核的生物)和真核生物(eukaruotes,具有细胞核的生物)两大类。原核生物包括古菌(archaea)和细菌(bacteria);真核生物包括植物(plant)、动物(animal)和真菌(fungus)。每类生物都可以进一步分类,例如植物可以分为藻类植物、苔藓类植物、蕨类植物、种子植物等。动物可以分为无脊椎动物和脊椎动物,其中脊椎动物又可以分为鱼类、两栖类、爬行类、鸟类和哺乳类。我们人类就是动物中的哺乳类动物。除了这种分类方法,是不是还有其他分类法呢?
1987年,英国科学家汤玛斯 卡弗利尔-史密斯(thomas cavalier-smith,1942-)提出,真核生物还可以根据鞭毛的数量来分类。例如有一根鞭毛的和有两根鞭毛的生物就不是同类。这里说的鞭毛,是指真核生物的鞭毛,成分和结构和原核生物的鞭毛不同。
例如单细胞的衣藻(chlamydomonas,一种绿藻)有两根鞭毛,植物的孢子和配子也是双鞭毛的,而且这些鞭毛都长在细胞的前端,即细胞运动的方向。与此相反,动物的精子(包括人类的精子)、真菌的游动孢子、以及一些单细胞生物如领鞭毛虫(choanoflagellate)则只有一根鞭毛,而且长在细胞的后方,通过摆动“推”着细胞前进,它们和植物应该不是同一类生物。从这个事实出发,地球上所有的真核生物可以被分为两个大类:单鞭毛生物(unikonta)和双鞭毛生物(bikonta)。它们各自都包括单细胞生物和多细胞生物,所以是很大的门类。例如单鞭毛生物就包括多细胞的动物和真菌,以及单细胞的原生动物如领鞭毛虫,也就是包括所有的动物和真菌。而双鞭毛生物则包括植物界中所有的生物,包括藻类和陆生植物。
不过单凭鞭毛的数量来给生物分类,理由好像不那么充足。要是有些生物后来丢掉了一些鞭毛呢?刚毛藻(cladophora,也是绿藻的一种)的配子像衣藻一样,有两根鞭毛,而孢子却有四根鞭毛。仅凭一根鞭毛就把一些单细胞生物、真菌和多细胞动物分为一类也让人疑惑:真菌的菌丝不运动,而且能够从顶端伸长,不是更像植物吗?怎么和动物弄到一起去了?仅凭有些单细胞生物只有一根鞭毛,就和多细胞的动物归为一类,能够使人信服吗?这样做,相当于把所有的真核生物纵向切成两大块,分别是单鞭毛生物和双鞭毛生物,每一块都包含了最简单的到最高级的生物,这远比传统分类中的“门”(phylum),甚至“界”(kingdom)还要大,这样的生物块是不是太大了?它们真的存在吗?
但是科学研究的结果却表明,cavalier-smith的想法是有道理的,证据就是生物进化过程中一些分子的特征性变化。如果一些生物具有这种特征性变化,而其他生物没有这种变化,具有这种特征性变化的生物就应该来自共同的祖先,属于同门类的生物。例如在原核生物中,有三个与嘧啶(dna的组成成分之一)合成有关的酶,分别是氨甲酰磷酸合成酶(carbamoyl phosphate synthase)、天冬氨酸转氨甲酰酶(aspartate carbamoyltransferase)、和二氢乳酸酶(dihydroorotase)。这三个酶各有为自己编码的基因,在细胞中分别合成。这三个酶彼此协作,用谷氨酰胺为原料合成嘧啶。真核生物是从原核生物进化而来的,在真核生物中,这三个酶的情况又如何呢?在单鞭毛生物中,无论是单细胞单鞭毛生物的还是多细胞的动物和真菌,这三个功能彼此联系的酶都融合在一起,成为单一的多功能酶,即一个蛋白分子具有三种酶的活性。这就需要为这三个酶编码的基因也融合在一起,成为一个基因。由于这个转化过程需要三个基因经过两次融合才能成为一个基因,是一个概率非常低的事件,很难发生两次,所以是追踪生物进化路线有用的标记,这个融合基因也就以三个酶的头一个字母合在一起叫cad基因。所有的单鞭毛生物都有这个cad基因,即拥有融合的酶;而在双鞭毛生物,包括一些高级多细胞生物如植物中,这种融合并没有发生,三个基因仍然各自表达。这个事实说明,所有具有cad融合基因的生物(即单鞭毛生物,不管是单细胞的还是多细胞的)应该来自共同的祖先,和双鞭毛生物是不同类别的生物。
另一方面,植物中两个与胸腺嘧啶合成有关的酶,胸苷酸合成酶(thymidylate synthase)和二氢叶酸还原酶(dihydrofolate reductase)彼此融合在一起,而这种融合在任何单鞭毛生物中都未曾发生过,这说明双鞭毛生物也有自己共同的祖先。从这些事实出发,把有一根鞭毛的生物与有两根鞭毛的生物区分开,各自归为一大类是有道理的。
在单鞭毛生物中,鞭毛长在细胞的后面的生物叫作“后鞭毛生物”(opisthokont)。多细胞生物中的动物和真菌,以及单细胞生物中“领鞭毛虫”门(choanozoa)和“中粘菌门”(mesomycetozoa)中的生物,都属于后鞭毛生物。为了进一步证明单细胞的后鞭毛生物和多细胞动物的关系,在2005年,英国的科学家从20种生物中提取了dna,并且测定了为以下四个蛋白编码基因的dna序列:真核生物的转译延长因子(eukaryotic translation elongation factor 1a ,简称ef-1a)、热休克蛋白70(heat shock prtotein 70,简称hsp70)、肌动蛋白(actin)、beta-微管蛋白(beta-tubulin)。在比较这4个基因在不同动物中的序列差别之后,科学家发现,后鞭毛生物确实是一个独立的门类,包括单细胞的后鞭毛生物和多细胞的动物和真菌。例如在所有的后鞭毛生物中,ef-1a蛋白序列中都有一个12个氨基酸单位的插入,而双鞭毛生物则没有这个插入,这就更加证明单细胞的后鞭毛生物和多细胞动物确实有共同的祖先。
这些事实都表明,在真核生物形成的初期,还在单细胞的阶段,就已经分化出单鞭毛细胞(如领鞭毛虫)和双鞭毛细胞(如衣藻)这两类细胞了。单鞭毛细胞后来发展成为真菌和多细胞动物,同时有些单鞭毛生物仍然以单细胞状态存在。双鞭毛生物后来发展成为藻类和陆生植物,同时也有一些继续以单细胞状态存在。尽管单细胞生物后来发展成为多细胞生物,但是单鞭毛和双鞭毛的基本特征仍然存在。两大类生物各有特点,成为地球上彼此区别的两大类生物。
既然单细胞的后鞭毛生物和多细胞动物属于同一大类的生物,有共同的祖先,多细胞动物就很可能是从单细胞的后鞭毛生物发展出来的。如果能够找出单细胞的后鞭毛生物和多细胞的动物更多的共同点,就可以进一步证明他们同属单鞭毛生物。科学家使用的方法,还是检查代表性生物的全部dna序列,比较它们所拥有的基因。
2008年,由美国多个研究机构和德国的科学家合作,测定了单细胞的单鞭毛生物领鞭毛虫门中领鞭毛虫纲(choanoflagellate)中monosiga brevicollis的全部dna序列。2013年,美国科学家测定了领鞭毛虫纲中的另一个物种,“群体形成性领鞭毛虫”(salpingoeca rosetta,因其能够聚集形成群体)的全部dna序列。也是在2013年,西班牙和美国的多家研究机构的科学家合作,发表了领鞭毛虫门,卷丝球虫纲中capsaspora owcazarzaki的全部dna序列。对这些dna序列的分析得出了惊人的发现,大大超出科学家当初的预期。为了叙述简洁,下面我们用mbre代表monosiga brevicollis,用sros代表salpingoeca rosetta ,用cowc代表capsaspora owcazarzaki。
要形成多细胞动物,需要细胞之间能够粘连。在多细胞动物中,这种粘连主要是通过钙粘蛋白(cadherin)来实现的。科学家没有想到的是,钙粘蛋白的基因在以上三个物种的单细胞生物中都有发现。
动物的上皮细胞通过“整连蛋白”(integrin)、纤连蛋白(fibronectin)、和层粘连蛋白(laminin)与细胞外由胶原蛋白(collagen)组成的细胞外基质相连。而在cowc和mbre中,所有这四种类型的基因都已经出现。
有些转录因子(transcription factors,结合与基因启动子上的dna特殊序列,控制基因开关的蛋白质)被认为是多细胞动物所特有的,例如p53、myc、sox/tcf,可是在cowc和mbre中,这些基因也已经存在。
更令人惊异的是,过去被认为是多细胞动物特有的信号传递链上的分子,蛋白质酪氨酸激酶(protein tyrosine kinase,简称tk,在蛋白质分子中的酪氨酸残基上加上一个磷酸分子),在这些单细胞生物中被大量发现。在mbre中,竟有128种酪氨酸激酶,比人类的酪氨酸激酶数量还多38种!与酪氨酸激酶配合作用的酪氨酸磷酸酶(tyrosine phosphatase,把酪氨酸激酶加在酪氨酸残基上的磷酸分子去掉)在这些生物中也有发现。
最有趣的是群体形成性领鞭毛虫sros。虽然它仍然是单细胞的生物,但是已经能够以5种细胞形态存在:慢游泳单细胞(领鞭毛虫的典型形态,包括鞭毛和领毛)、快游泳单细胞(领毛已经消失,只剩鞭毛)、通过杯形鞘壳附着在固体上(叫thecate cells),聚集成链的细胞,和聚集成玫瑰花座形(rosette)的细胞,这也是其名称salpingoeca rosetta的由来。在sros中,和多细胞动物器官形成有关的几个信号通路中的一些成分,以及使细胞出现极性的一些蛋白质成分已经出现。对sros的基因分析表明,wnt信号通路中的wnt基因和连锁蛋白(catenin)基因、刺猬蛋白(hedgehog)信号通路中含有刺猬蛋白信号段的基因以及含有刺猬蛋白前体中负责肽链自我切断的部分的基因、骨形态蛋白(bmp)信号通路中的smad基因、转化生长因子(tgf)信号通路中的tgfb和tgfb受体基因、以及使细胞出现极性的crumb复合物中为patj蛋白编码的基因都已经出现。
以上事实说明,领鞭毛虫门的生物已经具有多细胞动物所需要的一些功能蛋白域,包括细胞间相互作用所需要的蛋白(钙粘蛋白、整连蛋白、纤连蛋白、层粘连蛋白、notch信号通路)、细胞间信息传递(wnt信号通路、骨形态蛋白信号通路、转化生长因子信号通路、受体酪氨酸激酶、酪氨酸磷酸酶等)、以及多细胞动物特有的转录因子(p53、myc、sox/tcf等)。这些蛋白功能域在其他单细胞生物中没有发现,而只存在于领鞭毛虫门的生物中,这是领鞭毛虫门的生物是多细胞动物祖先,他们同属单鞭毛生物最强有力的证据。
从具有领毛,单细胞的领鞭毛虫到细胞没有领毛也没有鞭毛的人,其间经过了十几亿年的发展历程,模样也发生了翻天覆地的变化,但是人类精子后面那根鞭毛,却表明我们身体里面的细胞虽然已经没有鞭毛,但是我们的单细胞祖宗当初为长出鞭毛的基因仍然存在于我们的dna中,一有需要(精子形成时)又可以把鞭毛长回来,证明我们是单细胞后鞭毛生物的后代。这就像小说《西游记》中的孙悟空,在被二郎神追赶时变成一座庙,想逃过二郎神的眼睛,不过他的尾巴没有地方放,只能变成一根旗杆,竖在庙的后方。可是哪里有旗杆竖在庙后方的道理呢?二郎神据此判断出这个庙是孙悟空变的,先去捣孙悟空的眼睛(庙门两边的两个圆窗户),迫使孙悟空变回原形。人类精子后面那根鞭毛,就是暴露我们是后鞭毛生物后代的“旗杆”。
而且群体形成性领鞭毛虫就已经能够变成没有领毛,只有鞭毛的形式,模样和人类的精子非常相似。最简单的和最复杂的后鞭毛生物,在生命的一些阶段中竟然还能以同样的模样出现,不得不让人惊叹生物进化过程的精妙。