表观遗传学(英文:Epigenetics)研究非DNA序列变化情况下,相关性状的遗传信息通过DNA甲基化、染色质构象改变等途径保存并传递给子代的机制的学科。
学科信息
中文名称:表观遗传学
英文名称: epigenetics
学科分类:遗传学
表观遗传学是与遗传学(genetic)相对应的概念。遗传学是指基于基因序列改变所 致
基因表达水平变化,如基因突变、基因杂合丢失和
微卫星不稳定等;而表观遗传学 则是指基于非基因序列改变所致基因表达水平变化,如
DNA甲基化和
染色质构象变化等;
表观基因组学(epigenomics) 则是在基因组水平上对表观遗传学改变的研究。
概念定义
中文
在生物学中,表观遗传学这个名词指的是基因表达中的多种变化。这种变化在细胞分裂的过程中,有时甚至是在
隔代遗传中保持稳定,但是不涉及到基本DNA的改变。
这个概念意味着即使
环境因素会导致生物的
基因表达出不同,但是基因本身不会发生改变。表观遗传学在
真核生物中的变化主要被举例为
细胞分化过程
中干细胞分化成与胚胎有关的多种细胞这一过程。这个过程通过一些可能包含某些基因的沉默,移除某些基因上沉默的标志并且永久的失活于其他基因的机制变得稳定。
英文
mechanisms which may include silencing of some genes, removal of silencing marks on some other genes and permanently inactivating still other genes.
DNA甲基化
所谓
DNA甲基化是指在DNA甲基化
转移酶的作用下, 在基因组CpG二
核苷酸的
胞嘧啶5'碳位共价键结合一个 甲基基团。正常情况下,
人类基因组“ 垃圾”序列的CpG二核苷酸相对稀少,并且总是处于甲基化状态,与之相 反,人类基因组中大小为100—1000 bp 左右且富含CpG二核苷酸的
CpG岛则总是处于未甲基化状态,并且与56% 的人类基因组编码基因相关。人类基因组序列草图分析结果表明, 人类基因组CpG岛约为28890个,大部分
染色体每1 Mb就有5—15个CpG岛,平均值为每Mb含10.5个CpG岛,CpG岛的数目与基因密度有良好的对应关系。 由于DNA甲基化与人类发育和肿瘤疾病的密切关系, 特别是CpG岛甲基化所致
抑癌基因转录失活问题,DNA甲基 化已经成为表观遗传学和
表观基因组学的重要研究内容。
染色质重塑
表观遗传学重塑
染色质重塑复合物依靠水解
ATP提供能量来完成染色质结构的改变,根据水解ATP的
亚基不同,可将复合物分为SWI/SNF复合物、ISW复合物以及其它类型的复合物。这些复合物及相关的蛋白均与转录的激活和抑制、
DNA的甲基化、
DNA修复以及
细胞周期相关。
ATRX、ERCC6、SMARCAL1均编码与SWI/SNF复合物相关的
ATP酶。ATRX突变引起
DNA甲基化异常导致数种
遗传性的智力迟钝疾病如:
X连锁α-
地中海贫血综合征、Juberg-Marsidi综合征、Carpenter-Waziri综合征、Sutherland-Haan综合征和Smith-Fineman-Myers综合征,这些疾病与
核小体重新定位的异常引起的
基因表达抑制有关。ERCC6的突变将导致Cerebro-Oculo-Facio-Skeletal综合征和B型Cockayne综合征。前者表现为出生后发育异常、神经退行性变、进行性
关节挛缩、夭折;后者表现出
紫外线敏感、
骨骼畸形、
侏儒、神经
退行性变等症状。这两种病对紫外诱导的
DNA损伤缺乏修复能力,表明ERCC6蛋白在DNA修复中有重要的作用。SMARCAL1的突变导致Schimke
免疫性骨质发育异常,表现为
多向性T细胞
免疫缺陷,临床症状表明SMARCAL1蛋白可能调控和
细胞增殖相关的基因的表达。BRG1、
SMARCB1和BRM编码SWI/SNF复合物特异的ATP酶,这些酶通过改变
染色质的结构使成细胞
纤维瘤蛋白(Retinoblastoma protein, RB蛋白)顺利的行使调节细胞周期、抑制生长发育以及维持
基因失活状态的功能,这三个基因的突变可导致肿瘤形成。
DNA复制相关
组蛋白乙酰化与基因活化以及
DNA复制相关,组蛋白的去乙酰化和基因的失活相关。乙酰化
转移酶(HATs)主要是在组蛋白H3、H4的N端尾上的
赖氨酸加上乙酰基,去
乙酰化酶(HDACs)则相反,不同位置的修饰均需要特定的酶来完成。乙酰化酶家族可作为辅
激活因子调控转录,调节细胞周期,参与
DNA损伤修复,还可作为
DNA结合蛋白。去乙酰化酶家族则和
染色体易位、
转录调控、基因沉默、
细胞周期、
细胞分化和增殖以及
细胞凋亡相关。
CREB结合蛋白(CREB binding protein,
CBP)、E1A结合蛋白p300(E1A binding protein p300,EP300)和
锌指蛋白220(zinc finger 220,ZNF220)均为乙酰化
转移酶。CBP是
cAMP应答元件结合蛋白的辅激活蛋白,通过乙酰化
组蛋白使和cAMP
应答元件作用的
启动子开始转录,它的突变导致Rubinstein Taybi综合征,患者
智力低下、面部畸形、拇指和
拇趾粗大、身材矮小。CBP和EP300均可抑制肿瘤的形成,在
小鼠瘤细胞中确定了CBP的突变,在结肠和乳房瘤
细胞系中确定了EP300的突变,另外ZNF220异常和人的急性进行性髓性白血病相关。
如果突变导致错误的激活去乙酰化酶或错误的和去乙酰化酶相互作用,将可能导致疾病的发生。甲基化CpG-
结合蛋白-2(methyl cytosine binding protein-2,MeCP2)可募集去
乙酰化酶到甲基化的DNA区域,使
组蛋白去乙酰化导致染色质浓缩,MeCP2的突变导致
Rett综合征,患者出生即发病、智力发育迟缓、伴
孤独症。若阻碍去乙酰化酶的功能,则可抑制
癌细胞的增殖和分化,可用于急性
早幼粒细胞性白血病,
急性淋巴细胞性白血病和
非何杰金氏淋巴瘤的治疗。
染色质重塑异常引发的人类疾病是由于重塑复合物中的关键蛋白发生突变,导致染色质重塑失败,即
核小体不能正确定位,并使修复DNA损伤的复合物,
基础转录装置等不能接近DNA,从而影响基因的正常表达。如果突变导致
抑癌基因或调节细胞周期的蛋白出现异常将导致癌症的发生。乙酰化酶的突变导致正常基因不能表达,去乙酰化酶的突变或一些和去乙酰化酶相关的蛋白的突变使去乙酰化酶错误募集将引发肿瘤等疾病。
基因组印记
基因组印记是指来自父方和母方的
等位基因在通过精子和卵子传递给
子代时发生了修饰,使带有
亲代印记的等位基因具有不同的表达特性,这种修饰常为DNA甲基化修饰,也包括
组蛋白乙酰化、甲基化等修饰。在
生殖细胞形成早期,来自父方和母方的印记将全部被消除,父方等位基因在
精母细胞形成精子时产生新的甲基化模式,但在受精时这种甲基化模式还将发生改变;母方等位基因甲基化模式在
卵子发生时形成,因此在受精前来自父方和母方的等位基因具有不同的甲基化模式。发现的
印记基因大约80%成簇,这些成簇的基因被位于同一条链上的
顺式作用位点所调控,该位点被称做印记中心(imprinting center, IC)。印记基因的存在反映了性别的竞争,从发现的印记基因来看,父方对胚胎的贡献是加速其发育,而母方则是限制
胚胎发育速度,亲代通过印记基因来影响其下一代,使它们具有性别行为特异性以保证本方基因在遗传中的优势。
印记基因的异常表达引发伴有复杂突变和表型缺陷的多种人类疾病。研究发现许多印记基因对胚胎和胎儿出生后的
生长发育有重要的调节作用,对行为和大脑的功能也有很大的影响,印记基因的异常同样可诱发癌症。
基因组印记
BWS患者表现为胚胎和胎盘过度增生,巨舌,巨大发育,
儿童期易发生
肿瘤。该病主要是由
11号染色体上的IGF2和CDKN1C两个印记基因的错误表达引发,IGF2为父本表达的
等位基因,CDKN1C为母本表达的等位基因。父本单亲二体型(
uniparental disomies, UPDs)是引发BWS的主要原因,即IGF2基因双倍表达,CDKN1C基因不表达;次要原因是母本的CDKN1C等位基因发生突变[22];极少数病例是由于母本的染色体发生移位造成CDKN1C基因失活和(或)造成母本的IGF2
基因表达。其它一些印记基因在
胚胎发育过程中的过量或缺失表达也可导致类似于BWS的综合征,如原来母本表达的IPL基因的不表达或母本的ASCL2基因逃避印记都将导致胚胎的过度发育。这表明父本表达的等位基因对胚胎的生长有
促进作用,而母本表达的等位基因对胚胎的发育起到
限制作用。
基因组印记与Prader-Willi/Angelman综合征(PWS/AS)
PWS表现为肥胖、
身材矮小和轻度智力
发育迟缓;
AS表现为
共济失调、过度活跃、严重智障、少语、表情愉悦,这两种疾病都和神经功能失调相关。PWS是由于突变导致父本印记基因在大脑中高表达所致,如SNPNP基因高表达;AS是由于母本的UBE3A基因的缺失或受到抑制所致,该基因编码泛素蛋白
连接酶并在脑中表达。父本表达的SNRNP基因的微缺失可导致PWS,而在其上游进一步缺失则可导致AS,这说明这两个区域就是印记中心所在的位置。如果缺失父本染色体上的PWS印记中心将导致SNRNP基因以及附近的父本表达的
等位基因被抑制,而缺失父本染色体上的AS印记中心则没什么变化,但若缺失母本染色体上的AS印记中心将导致UBE3A被抑制而导致AS。
基因组印记丢失
印记丢失不仅影响
胚胎发育并可诱发出生后的
发育异常,从而导致癌症发生。如果
抑癌基因有活性的
等位基因失活便提高了发生癌症的几率,例如IGF2
基因印记丢失将导致多种肿瘤,如Wilm’s 瘤。和印记丢失相关的疾病还有
成神经细胞瘤,急性
早幼粒细胞性
白血病,
横纹肌肉瘤和散发的
骨肉瘤等。
与基因组印记相关的疾病常常是由于印记丢失导致两个等位基因同时表达,或突变导致有活性的等位基因失活所致。调控
基因簇的印记中心发生突变将导致一系列基因不表达,引发复杂综合征。基因组印记的本质仍为
DNA修饰和蛋白修饰,所以和印记相关的蛋白发生突变也将导致表观
遗传疾病。
染色体失活
X染色体失活
女性有两条X染色体,而男性只有一条X染色体,为了保持平衡,女性的一条
X染色体被永久失活,这便是“
剂量补偿”效应。哺乳动物雌性个体的
X染色体失活遵循n-1法则,不论有多少条X染色体,最终只能随机保留一条的活性。对有多条X染色体的个体研究发现有活性的染色体比无活性的染色体提前复制,复制的
异步性和LINE-1元件的非随机分布有可能揭示染色体失活的本质。哺乳动物受精以后,X染色体发生系统变化。首先父本X染色体(paternal X chromosome, Xp)在所有的早期胚胎细胞中失活,表现为整个染色体的
组蛋白被修饰和对细胞分裂有
抑制作用的Pc-
G蛋白(
Polycomb group proteins, Pc-G)表达,然后Xp在内
细胞群又选择性恢复活性,最后父本或
母本X染色体再随机失活。
X染色体随机失活是
X失活中心(X inactivation center, Xic)调控的。Xic是一个顺式作用位点,包含辨别X染色体数目的信息和Xist基因,前者可保证仅有一条染色体有活性,但机制不明,后者缺失将导致X染色体失活失败。X染色体失活过程为:Xist基因编码Xist RNA,Xist RNA包裹在合成它的X染色体上,引发X染色体失活;随着Xist RNA在X染色体上的扩展,
DNA甲基化和
组蛋白的修饰马上发生,这对X染色体失活的建立和维持有重要的作用;失活的染色体依旧持续合成Xist RNA,维持本身的失活状态,但有活性的X染色体如何阻止Xist RNA的结合机制还不明确。
相关疾病
和X染色体失活相关的疾病多是由X染色体的不对称失活使携带有突变
等位基因的X染色体在多数细胞中具有活性所致。
Wiskott-Aldrich综合征表现为免疫缺陷、
湿疹、伴
血小板缺乏症,该病是由于WASP基因突变所致。因为染色体随机失活导致女性为
嵌合体,携带有50%的正常基因,通常无症状表现,该病患者多为男性。存在女性患病的原因在于不对称X染色体失活,即携带有正常WASP基因的染色体过多失活。但女性体内还存在另一种机制,通过不对称失活使携带有突变基因的X染色体大部分失活。对Pelizaeus-Merzbacher病的研究表明这种机制的存在,它使带有突变PLP基因的X染色体倾向于失活。RTT综合征也和不对称X染色体失活有关,携带有MeCP2突变基因的女性,X染色体失活时倾向于使携带有发生突变的等位基因的染色体失活。
即便是失活的X染色体,也有一部分基因可以逃避失活而存在两个有活性的
等位基因,但逃避失活的等位基因的表达水平有很大的差异。由于逃避失活而易使一些
抑癌基因丧失功能,这是引发女性癌症的一个重要原因。也有一些逃避失活的基因过量表达而增加某些疾病的
易感性,如TIMP1基因随着年龄的增加表达量逐渐增加,导致迟发型疾病。女性易感的
自身免疫性疾病也和X染色体失活相关,因为女性为
嵌合体,如果自身免疫性T细胞不能耐受两个X染色体所编码的抗原,则会导致自身免疫缺陷性疾病,如
红斑狼疮等。
非编码RNA
作用
功能性
非编码RNA在
基因表达中发挥重要的作用,按照它们的大小可分为
长链非编码RNA和
短链非编码RNA。
长链非编码
RNA在
基因簇以至于整个染色体水平发挥
顺式调节作用。在
果蝇中调节“
剂量补偿”的是roX RNA,该RNA还具有
反式调节的作用,它和其它的蛋白共同构成MSL复合物,在雄性果蝇中调节X染色体活性。在
哺乳动物中Xist RNA调节X染色体的失活,其具有特殊的
模体可和一些蛋白共同作用实现X染色体的失活。Tsix RNA是Xist RNA的
反义RNA,对Tsix起
负调节作用,在X染色体
随机失活中决定究竟哪条链失活。air RNA调节一个基因簇的表达,该基因簇含有3个调节生长的基因。长链RNA常在
基因组中建立单
等位基因表达模式,在
核糖核蛋白复合物中充当催化中心,对
染色质结构的改变发挥着重要的作用。
短链RNA在基因组水平对
基因表达进行调控,其可介导
mRNA的降解,诱导染色质结构的改变,决定着
细胞的分化命运,还对
外源的核酸序列有
降解作用以保护本身的基因组。常见的短链RNA为小干涉RNA(short interfering RNA,
siRNA)和微小
RNA(microRNA,
miRNA),前者是
RNA干扰的主要执行者,后者也参与RNA干扰但有自己独立的作用机制。
疾病
非编码RNA对防止疾病发生有重要的作用。
染色体着丝粒附近有大量的
转座子,转座子可在染色体内部转座导致
基因失活而引发多种疾病甚至
癌症,然而在着丝粒区存在大量有活性的短链RNA,它们通过抑制转座子的转座而保护基因组的稳定性。在
细胞分裂时,短链RNA异常将导致染色体无法在着丝粒处开始形成
异染色质,细胞分裂异常,如果干细胞发生这种情况可能导致癌症的发生。siRNA 可在外来核酸的诱导下产生,通过RNA干扰清除外来的核酸,对
预防传染病有重要的作用。
RNA干扰已大量应用于疾病的研究为一些
重大疾病的治疗带来了新的希望。
非编码RNA不仅能对整个染色体进行活性调节,也可对单个基因活性进行调节,它们对基因组的稳定性、细胞分裂、
个体发育都有重要的作用。
RNA干扰是研究人类疾病的重要手段,通过其它物质调节RNA干扰的效果以及实现RNA干扰在特异的组织中发挥作用是未来RNA干扰的研究重点。
注释
研究基因的
核苷酸序列不发生改变的情况下,
基因表达了可遗传的变化的一门遗传学分支学科。
表观遗传的现象很多,已知的有
DNA甲基化(DNA methylation),
基因组印记(genomic impriting),
母体效应(maternal effects),
基因沉默(gene silencing),
核仁显性,休眠转座子激活和
RNA编辑(RNA editing)等,国际上表观遗传学已经构成了
系统遗传学研究的一个重要方面。
相关
表观遗传学是与遗传学(genetic)相对应的概念。遗传学是指基于基因序列改变所致基因表达水平变化,如基因突变、基因杂合丢失和
微卫星不稳定等;而表观遗传学则是指基于非基因序列改变所致基因表达水平变化,如
DNA甲基化和染色质构象变化等;
表观基因组学(epigenomics)则是在基因组水平上对表观遗传学改变的研究。所谓DNA甲基化是指在DNA甲基化转移酶的作用下,在基因组CpG二
核苷酸的
胞嘧啶5'碳位
共价键结合一个甲基基团。正常情况下,
人类基因组“垃圾”序列的CpG二核苷酸相对稀少,并且总是处于甲基化状态,与之相反,人类基因组中大小为100—1000
bp左右且富含CpG二核苷酸的CpG岛则总是处于未甲基化状态,并且与56%的人类基因组编码基因相关。人类
基因组序列草图分析结果表明,人类基因组CpG岛约为28890个,大部分染色体每1 Mb就有5—15个CpG岛,
平均值为每Mb含10.5个CpG岛,CpG岛的数目与基因密度有良好的对应关系[9]。由于DNA甲基化与人类发育和肿瘤疾病的密切关系,特别是CpG岛甲基化所致抑癌基因转录失活问题,DNA甲基化已经成为表观遗传学和表观基因组学的重要研究内容。
延伸阅读
遗传离不开变异,因为变异是遗传的物质基础,如果没有变异,遗传物质一成不变,生物不能适应新的环境和变化的环境,物种不能延续。在分子水平上,遗传变异的机制就是构成DNA序列的碱基的改变,包括单碱基的替换、缺失、插入,整条基因的拷贝数变化,以及同时包括很多基因的染色体区段的拷贝数变化或重排。按照经典遗传学理论,以上所有种类的遗传变异都是基于核苷酸序列的改变,导致基因表达/功能的改变,进而导致性状的变异。然而在生活中却存在一些与遗传学有关却用经典遗传学无法解释的现象,如人体内每个细胞都有相同的一组基因,但会分化成不同类型的细胞,进而发育成不同的组织和器官;还有,同卵双胞胎即使拥有完全相同的基因,也无法在外貌言行上做到100%的一致。
以上问题的答案就是表观遗传变异,其与遗传变异的本质区别是不需要DNA序列的改变,这是表观遗传学最重要的本质特征。表观遗传学的概念最初由著名生物学家康拉德·哈尔·沃丁顿于1942年提出,用来定义基因与环境的互作产生表型,其含义是:同一个基因型在不同环境条件下会产生不同的表型。其中,最显而易见的例证就是一个个体可以呈现出的多种多样的发育表型。我们知道,一个生物个体只有一种基因型,但不同发育时期、不同器官、不同组织的表型是具有本质差异的,如前所述,我们人体的不同器官在表型和功能上都是迥然不同的,但它们都具有一个相同的基因型,这是基因选择性表达的结果,而对这些基因进行调控的就是表观遗传变异。既然表观遗传变异不需要DNA序列变异,那么它是如何导致可遗传基因表达改变的呢?真核生物的DNA不是单独存在的,而是缠绕在四种组蛋白分子上构成染色质。研究表明,表观遗传变异是通过对染色质(包括DNA和组蛋白)的共价化学修饰而实现的。具体来说,表观遗传变异包括DNA甲基化、组蛋白修饰的改变、染色质重塑以及非编码RNA丰度的变化等。对于同卵双胞胎而言,二者在成长的过程中不可能处在完成相同的生活环境中,研究发现,随着年龄的增长,同卵双胞胎之间在基因组范围内的DNA甲基化修饰和组蛋白乙酰化的修饰差异越来越大,说明环境条件使得同卵双胞胎之间出现了表观遗传修饰的差异,进而引起了表型的不同。
作为生命科学的重大发现和新的研究热点,表观遗传学是近年来遗传学发展最快的领域,并成为一门独立的遗传学分支学科。越来越多的研究都表明,表观遗传学在物种形成、生物进化、作物改良和人类健康中都具有重要作用。