多重序列比对(Multiple sequence alignment;MSA)是对三个以上的生物学序列(biological sequence),如蛋白质序列、DNA序列或RNA序列所作的序列比对。一般来说,是输入一组假定拥有演化关系的序列。
简介
从MSA的结果可推导出序列的同源性,而种系发生关系也可引导出这些序列共同的演化始祖。如图1所示,视觉化叙述可描绘出各种突变事件,例如:点突变的单格变化、删除突变与插入突变等等。MSA常用来研究序列的保守性(conservation),或是
蛋白质结构域的三级结构与二级结构,甚至是个别的氨基酸或核苷酸。
支序分类学
支序分类学(英语:Cladistics)又称亲缘分支分类学,是一种
生物分类的
哲学,其指只依据
演化树分支的顺序,而不参考形态上的相似性来排列物种。此一学派的主要贡献者一般认为是德国昆虫学家威利·汉宁根,他称此为
种系发生系统学。
分支研究的最终结果是由被称之为“分支图”的树状关系图来描绘出其假定的关系。现代的系统学研究会收集各方面的资料,包括
DNA序列、
生化数据和
形态学上的数据等。
在一个“分支图”中,所有的生物体都如同一片
树叶,且每个内节点理想上都是二元(有两条分歧)的,在此一分歧点两端的
分类群即称为“旁系分类群”或“旁系群”。每一枝干,不论其包含了上万种类别或只有一种类别,都被称做是一个
分支。一个自然的类群应该会有包含在任一分支里的所有生物体,这个分支会有着属于此一分支的唯一祖先(一个不会是此一分支外的其他生命体的祖先)。每一分支都会有一些只共同出现在分支内每一个成员上,而不会出现在其他生命体上的特征。这些特征称之为
衍征。例如,坚硬的前
翅(
鞘翅)是
鞘翅目的衍征,而
幼叶卷叠式-由卷曲的幼芽舒展成
叶子则是
蕨类植物的衍征。
支序分类方法
分支分类分析必须收集信息,并区分什么是“一般特征”什么是“特殊性状”。在以前,研究者必须区分哪些特殊性状是共同祖先以前具有的(祖征),哪些是共同祖先单独具有的特征(共源性状),要和分支以外的种群比较,只有共源性状才能用来确定一个分支。
要确定一个分支,必须有足够大量的共源性状,才能说明这种特征不是由于共同的祖征,不是由于趋同进化造成的同形相似(因为生活在同一环境,而不是因为有同一祖先造成的相似特征)。例如
鸟类和
昆虫有生活在相似的环境中都具有的翅膀(共同的特征),但却是沿着不同的进化路线发展的,如果将它们放到一个分支内就是错误的。
共源特征确定后,要依照简约化的原理确定之间的关系(也是一种
奥卡姆剃刀原理),另外也主要也依照分子进化理论,选取最接近的分支。
现代不太容易出现由于研究者自身造成的偏差,因为一般分析都使用
计算机软件,有各种复杂的
软件可以用来分析和计算分支。
现代
DNA系列的测定已经比较容易,
种系发生学得到分子数据的支持。计算机系统可以处理大量的数据,能精确筛选出真正的共源特征数据。更为有效的方法是利用
染色体中的反转座子记号。最理想的是将
形态学、
分子生物学、以及行为生态等种系发生学的信息结合起来,没有一种方法是完全完美的。所有的方法都有自己的误差,在形态学中经常发生趋同进化的错误,但在分子生物学中却经常有和外在特征冲突的现象,分子数据虽然比利用
化石数据更精确,但也充满误差。各种方法的比较和结合,才能得到更好的结果。
亲缘分支理论并不能取代所有的进化理论,只是对现有的知识进行一些修正。这种理论也可以使用到
生物学以外的领域,已经应用到
历史语言学中确定语言的族属分类,和古代文献考订中确定文献派生情况等。
支序分类法分类
自从1960年代以来,生物界出现倾向用
亲缘分支分类法的“分支主义”,他们主张取消所有非分支的分类系统。但其他分类学家认为虽然
种系发生学要应用亲缘分支的技术,但分类仍然有使用传统的
门类的必要,两种分类法都应该存在,因为不仅存在单源种系,也有同源种系。
单源种系可以应用分支,全体种系都是从一个祖先派生出来的。同源种系虽然意义相同,但其中一部分种群有独立的进化道路,产生很大的区别。例如
鸟类和
爬行类具有同一祖先,但进化道路相当不同。
脊椎动物和
无脊椎动物也是从共同祖先演化来的,但不能分到同一类中。
此外还有多源种系,例如以前分到一类“厚皮类”中的动物
象和
犀牛并不是来源于同一祖先,而是各自由不同的薄皮祖先进化来的。演化分类学者认为多源在分类学中是错误的,如同将趋同演化的动物或同形的动物分到一类中一样。
分支学者认为同源种系和多源种系是一样错误的,
单系群是依据共源性状,可以将各种群进行客观地分类。而同源和多源是依据外观特征,容易造成主观的错误。但其他学者认为分支法将种群分类从“低级”向“高级”分类,容易导致目的论,目的论是在演化研究中应该避免的。
分支学者认为传统的分类方法人为地将物种分成不同的层次,不能真正代表物种演化的实际情况,因此应该放弃
林奈的分类法,全部使用简单的亲缘分支层次。
而其他有不同意见的学者认为所有的分类方法都是人为的,都有主观因素在内,所有物种都是在持续不断地演化,任何分类划分都是人为制造前半部单一起源,后半部同源发展,在
树形结构的早期就应用同源分类是必要的。例如发展成为灵长类的早期脊椎动物不能放到任何单源分支中。他们还认为同源分类提供了生物形态、
生态即生命演化历史中重要变化的信息。也就是说传统分类和分支分类都很有价值,但在不同方面是为不同目的而起作用。
系统发生学
系统发生学(
希腊语:φυλογένεση,
希腊语:φύλο,现代希腊语:fílo- 种系,性别和γεννήση,现代希腊语:jénnissi- 新生,诞生。
英语:Phylogenetics,又称系统发育学,简称为谱系学)是指在地球历史发展过程中
生物种系的发生和发展。
这个概念不单止用于动物种系的发生与发展,还会用在系统学各个层面的
分类单元上面。它也会被用到某一特征的在生物发育过程中的进化这一方面。
系统发生学的研究是通过以下的手段实现的:
通过这些数据,人们就可以为生物建立一棵系统发生学树(演化树),其中描述了各个
物种之间可能有的亲缘关系。
系统发生学研究的最大困难是,系统发生学的进化过程是不能被直接通过观察和实验被证实的。所以各个方面的证据都要被综合起来分析。由于对这些证据的侧重不同,会经常造成有多个不同的演化树版本,例如原口类动物的几个
门究竟是归到
蜕皮动物(来自遗传学方面的证据)还是
触手动物(形态学方面的证据)。
同源特征证实了物种间的亲缘关系,是重构进化树的有力手段。同源现象在生物学中可以进一步分为
直系同源(直系同源是指在不同物种中的某一基因来自同一祖先)和
旁系同源(种系间的基因复制) 。
参见