直系同源基因(orthologous gene)又译为“
垂直同源基因”、“正同源基因” 或“
定向进化同源基因”,是指从同一祖先垂直进化而来的基因。或者说,一个祖先物种分化产生两种
新物种,那么这两种新物种共同具有的由这个祖先物种继承下来的基因就称为直系同源基因。直系同源基因通常是编码生命必需的酶、辅酶或关键性的调控蛋白的基因,具有功能保守,进化缓慢,变化速度可覆盖整个进化历史,且序列变化速度与
进化距离相当等特征。大多数直系同源基因功能相同或相近,调控途径也相似, 因此在
基因组序列的注释中,是最可靠的选择,例如人α一珠蛋白基因与
小鼠α一珠蛋白基因。
旁系同源基因(paralogous gene)又译为“
横向同源基因”、“
并系同源基因”或“
平行进化同源基因”,是指由于
基因复制而产生的同源基因,例如人γ一珠蛋白基因和β一珠蛋白基因。基因复制后,进化
选择压力变小,其中一条基因丢失或发生沉默,都能促使旁系同源基因分化,产生新特性或新功能的原因。然而,虽然某些旁系同源
基因转录区序列相似度不高,但它们的
操纵子却仍然具有较高的保守度。值得注意的是,旁系同源基因并不局限于同一物种内,不同物种中由于始祖基因的复制而分化的基因也称旁系同源基因,如鼠α一珠蛋白和鸡β一珠蛋白基因。随着时间的推移,它们在序列组成和功能上可能会变得不同。
异源同源基因(xenologous gene)是由于基因在不同物种间的横向转移(horizontal transfer)而产生的。异源同源基因在
原核生物中研究比较多。最近研究表明,异源同源基因的原位取代(xenolo—gous gene displacement in situ)是细菌进化的强大
推动力。另外,在比较
真核基因组和原核生物
基因组时发现,小部分
脊椎动物基因在细菌中有同源序列,而在其他
真核生物中却没有发现同源序列。一种解释认为,这些基因从细菌直接水平地转移到脊椎动物的祖先,也是异源同源基因;另外一种解释则认为,是由于其他的真核生物丢失了这些基因。
基因的
直系同源、
旁系同源或异源同源关系。祖先物种通过两次物种分化形成ABC三个物种;伴随物种分化而进行的两次
基因重复共形成
A1、B1、B2、C1、C2、
C3等6个基因。显然,C2与C3互为直系同源;B1与C1互为旁系同源;AB1与其他6个基因互为异源同源。然而,B1和B2、B2和C1又是什么关系呢?在这个问题上曾引起争议。B1和B2、B2和C1的分离是由于第一次基因重复而产生的,套用定义,可得出B1和B2、B2和C1互为旁系同源。同理,B1和C2/C3、C1和C2/C3也互为旁系同源。类似的,根据直系同源基因的定义,B2和C2/C3、A1和所有B基因及
C基因互为直系同源。
以上只是根据基本定义进行的大致的归分。然而,在研究
亲缘关系较远的物种时,物种分化和
基因重复的嵌套发生使研究具有很大的复杂性和困难度。这时,笼统的划分
直系同源和
旁系同源关系并不足以解决问题,我们需要一个更为精确的分类。为了区别于B1和C1的简单的直向
同源关系,把B2和C2/C3的同源称为“
共生直向同源”(co—ortholog)或“横向同源基因家族谱系
特异性扩充”(1ineage—specific expansion ofparalogous family)。为了区分C2和C3、B1和C2/C3这两种同源关系,可以根据物种分化和
基因重复的发生的先后次序,把旁系同源基因又分为内旁系同源基因(inparalog)和外旁系同源基因(outparalog)。在物种分化之后产生旁系同源基因的称“内旁系同源基因”;在物种分化之前产生横旁系同源基因的称“外旁系同源基因”。 “内旁系同源基因”和“外旁系同源基因” 只是一种相对的划分,取决于所研究的系统和选作标准的某特定分化事件。若以第二次物种分化为
准线,则C2和C3的分离发生在物种分化之后,因此它们互为内旁系同源基因;B1和C2/C3的分离发生在物种分化之前, 因此B1和C2/C3互为外旁系同源基因。