- 新生儿基因筛查
- 赵正言 周文浩 梁德生主编
- 11844字
- 2025-03-19 15:08:06
第三节 基因复制与表达
一、DNA的复制
DNA复制是以初始的双链DNA为模板合成新的DNA的过程。在细胞分裂发生之前,整个基因组的DNA通过复制由一个拷贝变成两个,并分别传递给两个子细胞,其中包含了DNA储存的遗传信息。DNA复制具有半保留复制、双向复制、半不连续复制等主要特征。基因组进行DNA的复制过程可分为起始、延伸和终止三个阶段。
(一)DNA复制的过程
1.DNA复制的起始
DNA复制从复制起始位点(origin of replication)开始,其数目随生物物种不同而数目不等,原核生物基因组是环状DNA,只有一个复制起始点,真核生物基因组复杂庞大,每条染色体有多个起始位点。起始子(initiator)蛋白特异性地识别复制器(replicator)中的一个DNA元件并激活复制的开始。复制器的DNA序列富含腺嘌呤(A)和胸腺嘧啶碱基(T),更易于DNA双链的解旋。一旦复制起始点被识别,起始子蛋白就会协同一个或多个解旋酶装载蛋白共同将DNA解旋酶(DNA helicase)募集到复制器上,与其他起始位点上的蛋白共同作用产生单链DNA区域。新产生的单链DNA迅速与单链DNA结合蛋白(single-stranded DNA binding protein,SSB)结合以保证解开的单链在复制完成前能保持单链结构,有利于其作为模板进行DNA的合成或RNA引物的合成,等待单链复制后才脱下来,重新循环。解链过程中,拓扑异构酶(topoisomerase)通过切断、旋转和再连接的作用,消除由DNA解旋酶作用所引入的超螺旋积累。DNA解成单链后,引物酶(primase)以单链DNA区域为模板合成复制起始所需的RNA引物,这些引物随后由DNA聚合酶进行延伸。当引物合成后,复制体(replisome)的其他元件通过与形成的引物-模板接头相互作用进行组装,DNA聚合酶开始工作,进行DNA的合成延伸。
DNA的复制是从起始点开始向两个方向进行解链,进行双向复制。刚分开的模板链与未复制的双链DNA之间的连接区域称为复制叉,复制叉向着未复制的DNA双链区域连续运动。两条单链DNA复制的起始过程有所差异,前导链(leading strand)从复制起始点开始按5'→3'方向持续地合成下去,不形成冈崎片段,并且前导链DNA聚合酶在模板一解开后就可进行复制;而后随链(lagging strand)在其能够复制之前,必须等复制叉运动并暴露足够长的DNA模板后才能进行合成,并随着复制叉的出现,以不连续的方式,不断合成长1~2kb的冈崎片段。
2.DNA复制的延伸
复制一旦开始,复制叉即向前移动完成DNA复制的中心任务,以亲本链为模板,以脱氧三磷酸核苷酸(dATP、dCTP、dGTP、dTTP,统称为 dNTP)为底物,在 DNA 聚合酶的催化下合成互补的新链。复制叉上的前导链和后随链的合成是协同进行的,多种DNA聚合酶在复制过程中扮演不同的角色。在大肠埃希菌中,DNA聚合酶Ⅲ(DNA Pol Ⅲ)和其他增加功能的元件组成巨大的多蛋白复合体以实现协同作用,称为DNA Pol Ⅲ全酶。DNA Pol Ⅲ全酶及引发体等其他复制元件在复制叉附近组成类似核糖体大小的DNA复制体(replisome)。复制体沿5'→3'方向在DNA前导链模板和后随链模板上持续移动时便合成了连续的DNA前导链和由许多冈崎片段组成的后随链。DNA Pol Ⅲ是DNA合成延伸过程中主要的复制酶。但DNA Pol Ⅲ缺少5'→3'外切酶活性,当遇到下一个冈崎片段的RNA引物时,便停止DNA的合成,由DNA聚合酶Ⅰ接替。DNA聚合酶Ⅰ除了具有聚合酶活性外,还具有5'→3'外切核酸酶活性。因此,DNA聚合酶Ⅰ主要负责去除起始DNA合成所需的RNA引物和在所产生的单链DNA缺口中进行DNA的合成。当冈崎片段形成后,DNA聚合酶Ⅰ通过其5'→3'外切酶活性切除冈崎片段上的RNA引物,并将暴露的已无引物的模板区段延伸,此时相邻的2个冈崎片段首尾相连,最后由DNA连接酶(DNA ligase)将接头处还缺少的磷酸二酯键连接,形成完整的DNA后随链。在真核生物中也有多种DNA聚合酶参与基因组的复制,其中最重要的有三种。DNA聚合酶 alpha(DNA polymerase alpha,Polα)有助于启动复制,因为它与引物酶形成复合物,延伸能力相对较低。DNA聚合酶 epsilon(Pol ε)和DNA聚合酶delta(Pol δ)具有较高的延伸性,分别负责后随链和前导链的延伸。Pol δ还负责RNA引物的去除,而Pol ε也参与复制期间DNA的修复。
3.DNA合成的终止
当复制叉到达终点或遇上从相反方向延伸的另一个复制叉时会彼此停止复制。在大肠埃希菌中,DNA复制的终止发生在特定的区域,通过复制终止序列(terminator sequences)来调整该过程。当顺序专一性DNA结合蛋白(Tus)识别并结合终止序列时,仅允许复制叉一个方向的通行,从另一个方向过来的复制叉不能通过,阻止复制叉前进,复制终止。因此,复制叉总是在限定的终止区域内相遇,导致复制终止。环状染色体复制完成后,产生的子代DNA分子交互连接,由拓扑异构酶Ⅱ作用相互脱离,分别进入到子细胞中去。
所有新的DNA复制启动需要一条RNA引物,并且复制具有方向性,只能按5'→3'复制,使得线性染色体的DNA的复制无法到达染色体的最末端,最终导致线性DNA末端在每个复制周期中都会丢失,越来越短。在某些线性染色体细菌或病毒中,通过“引物蛋白”与后随链模板结合,用一个氨基酸来代替RNA引物提供的3'-OH,作为最后一个冈崎片段的引物。多数真核生物则是通过其他方法来解决染色体末端复制问题。端粒是真核生物染色体线性DNA分子末端的结构,由富含TG的重复序列构成。端粒酶由蛋白质和RNA组成,是一种特殊的DNA聚合酶,可使端粒作为一个独立的复制起始位点进行复制,利用其自身RNA作为模板,反复延长末端DNA序列的3'端,避免染色体末端渐进性丢失。然而,在多细胞生物中并非所有细胞染色体的复制都有端粒酶的参与,如在种系细胞中可检测到端粒酶的活性,而体细胞或分化细胞中端粒酶活性被抑制,结果导致每一代子细胞的染色体长度渐渐缩短,最终缩短至包含遗传信息的DNA序列附近时,细胞则停止分裂,逐渐衰老和死亡。
(二)真核基因组的复制
真核生物的细胞周期主要分为四个时期:即G1、S、G2和 M 期。G1、S、G2共同组成细胞分裂间期,M期为分裂期。真核生物的基因组复制发生在细胞周期的S期,即DNA合成期,且每个细胞分裂周期只能复制一次。真核生物DNA复制的起始和原核生物相似,但具有不同的调节机制。真核生物染色体通常每30kb就有一个起始位点,复制具有时序性,每个复制子以分组的方式激活。真核生物DNA复制起始的两个步骤发生在不同的细胞分裂周期。解旋酶的装载是真核生物启动复制起始的第一步,发生在细胞分裂的G1期。当细胞进入G1期时,起始识别复合物(ORC)与起始位点结合,募集解旋酶装载蛋白Cdc6和Cdt1,以及Mcm2-7解旋酶。装载后的解旋酶并不能立刻开始解旋,需要细胞周期依赖性激酶(cyclindependent kinase,CDK)和 Dbf4依赖性激酶(dependent kinase,DDK)的激活,此激活过程发生在S期。激活后,三种真核生物DNA聚合酶等按照一定的顺序在起始位点进行组装,启动复制。真核生物DNA是与组蛋白结合成核小体存在的。复制前,DNA在复制叉处从核小体上解离下来,待复制叉通过后,新合成的DNA链与原有的及新合成的组蛋白结合,立即重新组装成核小体。在细胞的S期,组蛋白的量也加倍了。核小体的解离仅局限于在复制叉附近的一小段区域内,复制叉移动使前方的组蛋白八聚体解聚成四聚体和二聚体;复制叉通过后,后方约600bp处的两条新合成的子链DNA与组蛋白重新随机组装。
真核生物DNA聚合酶的组成相对原核生物更加复杂,分工更加精细,通常有15种以上,包括DNA Pol α/引物酶、DNA Pol δβ、DNA Pol γ、DNA Pol δ、DNA Pol ε等,其 中 DNA Pol α/引 物 酶、DNA Pol ε、DNA Pol δ 最为重要。DNA Pol α 由4个亚基组成,具有RNA引物酶活性,可在起始点合成RNA引物,并利用其聚合酶活性继续延伸一段DNA短序列,很快再被DNA Pol ε或DNA Pol δ替代,完成后续DNA链的合成,此过程称为聚合酶的切换。真核生物DNA复制叉上工作的蛋白还有复制蛋白A(replication protein A,RPA)、增殖细胞核抗原(proliferating cell nuclear antigen,PCNA)、复制因子 C(replication factor C,RPC)、侧向内切核酸酶(FEN1)、RNA 酶 H(RNase H)、DNA连接酶Ⅰ、拓扑异构酶等。RPA是单链DNA结合蛋白,与细菌DNA结合蛋白SSB相似,其可促使DNA进一步解旋,激活Pol α/引物酶活性,还参与DNA的重组和修复。PCNA是DNA聚合酶的“滑动夹子”,在RFC的作用下与DNA结合,促使Pol δ获得持续合成长链DNA的能力;当DNA合成完成后,RFC将PCNA撤离。PCNA对Pol ε也有激活作用。真核生物DNA聚合酶均无5'→3'外切核酸酶活性,RNA引物的去除,通过FEN1和RNase H进行。FEN1具有核酸内切酶和5'→3'外切核酸酶活性,可特异性地去除冈崎片段5'端的RNA引物。RNase H为核酸内切酶,识别并除去各条RNA引物的大部分,在5'端残留一个核糖核苷酸,由FEN1去除。
二、基因的表达
基因表达主要是基因转录及翻译的过程,真核基因表达调控相比于原核基因环节更多,机制更复杂。个体内不同细胞的基因表达具有严格的时空特异性,每种细胞根据自身的特点表达其中的部分基因,从而发挥完全不同的生物学功能以满足各种生命活动的需要。基因表达调控是多级水平上进行的复杂事件,在真核生物中包括转录调控、转录后调控和翻译调控。
(一)中心法则
DNA是遗传物质,是携带遗传信息的载体。信息从基因的核苷酸序列中被提取出,用来指导蛋白质合成的过程。在DNA分子上,表现为特定的核苷酸排列顺序,并通过DNA的复制(replication)使遗传信息从亲代传向子代。在后代的生长发育过程中,DNA分子中的遗传信息转录(transcription)到RNA分子中(即RNA聚合酶以DNA为模板合成RNA),再由RNA翻译(translation)生成体内各种蛋白质,行使特定的生物功能。这样,通过遗传信息从亲代传向子代,并在子代表达,使得子代获得了亲代的遗传性状。RNA也能通过复制过程合成出与其自身相同的分子。此外,生物界还存在由RNA指导下的DNA合成过程,即反转录,这一过程发现于反转录病毒中。通过基因转录和翻译得到的蛋白质分子可以反过来作用于DNA,调控其他基因的表达。分子生物学的中心法则见图1-2,它说明遗传信息由DNA分子到RNA,再到蛋白质的传递过程。

图1-2 分子生物学的中心法则
(二)真核基因的转录过程、mRNA的剪切
基因表达(gene expression)的第一个阶段是转录,以DNA分子为模板,合成出与其核苷酸顺序相对应的RNA的过程。常见的RNA包括信 使 RNA(messenger RNA,mRNA)、转 运 RNA(transfer RNA,tRNA)和核糖体 RNA(ribosomal RNA,rRNA)。
原核生物通过一种RNA聚合酶转录所有基因,而真核生物有三种RNA聚合酶,分别为RNA Pol Ⅰ、RNA Pol Ⅱ、RNA Pol Ⅲ。蛋白质编码基因由RNA Pol Ⅱ转录。RNA聚合酶以4种核苷三磷酸为底物,DNA为模板,直接合成RNA链,合成方向为5'→3'。
真核基因的转录分为起始、延长和终止三个阶段。编码蛋白质的基因组成结构分为5'侧翼区、转录区和3'侧翼区。5'侧翼区为基因的上游,与转录起始有关。3'侧翼区为基因的下游,与转录的终止有关。转录起始于mRNA起始密码上游区方向,通过编码区,在3'区终止。真核生物RNA聚合酶依赖于转录因子对启动子的识别,才能开始转录。RNA聚合酶及相关的转录因子识别出启动子并与之结合。而后,DNA分子双螺旋局部解开,聚合酶识别出模板链,按照碱基配对原则催化形成磷酸二酯键。RNA聚合酶在DNA模板链上沿3'→5'方向移动,形成5'→3'方向延长的RNA链。RNA聚合酶移动至转录终止位点(终止子)时终止聚合反应终止,释放新合成的RNA链。终止子是转录的终止信号序列。
真核生物基因是由编码区(外显子)和非编码区(内含子)组合形成的。当RNA转录完成后,需要将内含子切除,并将外显子连接为成熟的mRNA。剪接首先需要明确内含子和外显子的边界。内含子的5'端通常以GU为起始,称为5'剪接位点,3'端通常为AG-OH,称为3'剪接位点。5'-GU……AG-OH-3'称为剪接接口(splicing junction)或边界序列,也称为剪接部位(splice site)。mRNA 前体中的内含子被“套索”(lariat)结构切除。内含子的5'剪接位点和分支点A以2',5'-磷酸二酯键相连成“套索”状结构,并被切除,同时两个外显子接合。这个剪接过程包括连续两步转酯反应(transesterification reaction):第一步将内含子的5'-磷与外显子1的3'-氧之间的酯键转变为内含子的5'-磷与分支点A的2'氧之间的酯键;第二步将外显子2的5'-磷与内含子3'-氧酯键的酯键转变为外显子2的5'-磷与外显子1的3'-氧之间的酯键,使内含子作为离去基团释放,外显子1和外显子2接合。最后释放mRNA产物。
上述转酯反应发生在剪接体(spliceosome)中。剪接体是一种超大分子(supramolecular)复合体,由5种RNA和约150种蛋白质装配而成,大小与核糖体接近,其功能多数是由RNA执行完成,主要为识别5'剪接位点和分支点;按需要将两个位点结合;催化RNA的剪切和连接。
除上述剪接外,前体mRNA分子的加工还有一种剪切(cleavage)模式。剪切指剪去某些内含子后,在上游的外显子3'端直接进行多聚腺苷酸化,不进行相邻外显子之间的连接反应。许多前体mRNA分子经过加工只产生一种成熟的mRNA,有些可加工成两条或多条结构不同的mRNA,从而翻译出不同的蛋白质,该现象称为选择性剪接。这个现象说明,这些可加工产生多种mRNA的前体mRNA分子可能具有两个以上的剪接位点,因而可通过剪切和/或选择性剪接形成不同的mRNA。选择性剪接提高了对基因数目的利用,是增加生物蛋白质多样性的机制之一。
(三)mRNA的翻译
在信息传递过程中,翻译比转录复杂得多。蛋白质以mRNA为模板,根据mRNA链上每三个核苷酸决定一个氨基酸的三联体密码规则(表1-1),合成具有特定氨基酸顺序的蛋白质肽链。蛋白质肽链合成的实质是将mRNA的核苷酸序列转换为蛋白质的氨基酸序列。
mRNA是蛋白多肽链合成的直接模板,而mRNA的核苷酸序列来自基因组DNA,因此指导多肽链合成的信息实际上是源于基因组DNA。换句话说,基因组DNA中的核苷酸排列顺序作为遗传信息,决定了多肽链中的氨基酸排列顺序。基因组DNA分子中只有4种碱基,而蛋白质中有20种氨基酸,显而易见,单个碱基无法作为氨基酸编码的单元。如果基因组DNA序列中每两个相邻的碱基对应一个氨基酸,则只能编码42=16种氨基酸;如果三个相邻碱基对应一个氨基酸,那么可以编码43=64种氨基酸,可以满足20种氨基酸的编码需要。1961年,弗朗西斯·克里克(Francis Crick)和3位科学家设计了一系列精巧的实验,证实了遗传密码的三联体形式(三个相邻的碱基组成三联体密码子,triplet codon),并且密码子是简并的(多个密码子组合可以代表同一个氨基酸)。他们的结果还表明,mRNA序列上的密码子依次排列,相邻密码子之间没有重叠也没有空格,一个密码子与一种氨基酸相对应。表1-1中列出了编码20种氨基酸的所对应的密码子。
表1-1 密码子表

遗传密码具有五个基本特点。
1.方向性
组成密码子的各碱基在mRNA序列中的排列具有方向性。翻译时的阅读方向只能从5'→3',即从mRNA的起始密码子AUG开始,按5'→3'的方向逐一阅读,直至终止密码子。mRNA开放阅读框中从5'→3'排列的核苷酸顺序决定了肽链中从N端到C端的氨基酸排列顺序。
2.连续性
mRNA的密码子之间没有任何起标点符号作用的间隔核苷酸。阅读密码必须按照一定的读码框架,从起始密码子开始,密码子被连续阅读,直至终止密码子出现。由于密码子的连续性,在发生插入或缺失1个或2个碱基的基因变异,即会使mRNA的阅读框发生移动,称为移码(frame shift),使改变位点后的氨基酸序列大部分被改变,其编码的蛋白质可能会彻底丧失功能,称为移码突变(frame-shift mutation);如同时连续插入或缺失3个碱基,则只会在蛋白产物中增加1个或缺失1个氨基酸,但不会导致阅读框移码,对蛋白质的功能影响相对较小。
3.简并性
64个密码子中有61个编码氨基酸,而氨基酸只有20种,因此大多数氨基酸具有多个密码子,这一现象被称为简并性(degeneracy)。为同一种氨基酸编码的各密码子称为简并性密码子。多数情况下,简并性密码子的前两位碱基相同,仅第三位碱基有差异,即密码子的特异性主要由前两位核苷酸决定。这意味着第三位碱基的改变往往不改变其密码子编码的氨基酸,合成的蛋白质具有相同的一级结构。因此,遗传密码的简并性具有重要的生物学意义,既在某种程度上降低了有害变异的出现频率,也可以使基因组DNA的碱基组成有较大的变动余地,有利于物种稳定性的保持。
4.摆动性
mRNA中的密码子能够与tRNA的反密码子通过碱基互补配对而相对识别结合。这种碱基配对有时并不严格遵循Watson-Crick碱基配对原则,出现摆动(wobble)现象。摆动配对能使一种tRNA识别mRNA序列中的多种简并性密码子。
5.通用性
除个别以外,从细菌到人类都使用着同一套遗传密码,这就是遗传密码的通用性。一方面为地球上的生物来自同一起源的进化论提供了有力依据,另一方面也为在基因研究过程中利用细菌等生物来制造人类蛋白质提供了依据。虽然遗传密码是通用的,但仍有个别例外。如对于哺乳类动物的线粒体基因组来讲,有些密码子编码方式不同于通用遗传密码,如UAG不代表终止信号而代表色氨酸,CUA、AUA编码有所不同,此外终止密码子亦不一样。
转运RNA(transporter RNA,tRNA)分子在蛋白质合成中具有重要作用。一个功能是氨基酸的运载工具,与各种氨基酸结合形成氨基酰-tRNA合成酶(aminoacyl-tRNA),再被运载至核糖体用于多肽链的合成。tRNA的另一个功能是作为氨基酸与mRNA密码子之间的分子“适配器”(adaptor),凭借tRNA上的反密码子与mRNA上的密码子通过碱基互补配对作用相互识别结合,从而使不同的氨基酸按照mRNA模板中不同的密码子依序装配出相应的多肽链。
蛋白质肽链的合成是从氨基端(N端)逐个加入氨基酸,直至羧基端(C端)最后一个氨基酸为止。多肽链合成的场所是核糖体,一个细菌细胞中约有20 000个核糖体,而真核细胞里则多达数百万个。它们的结构大同小异,都是由复杂的rRNA骨架和许多蛋白质组成的复合物,由大小两个亚基组成。
翻译过程包括起始(initiation)、延长(elongation)和终止(termination)三个阶段。翻译起始是指mRNA、起始氨基酰-tRNA与核糖体结合而形成翻译起始复合物。翻译起始复合物形成后,核糖体从mRNA的5'→3'移动,依据密码子顺序,从N端开始向C端延伸合成多肽链。这是一个在核糖体上重复进行的进位、成肽和转位的循环过程,每完成1次循环,肽链上即可增加1个氨基酸残基。如此反复,直到核糖体的A位对应到了mRNA的终止密码子上,释放因子可完成终止信号的识别,tRNA与肽链断裂,进而肽链从核糖体上脱落。随后,mRNA、tRNA与核糖体分离,核糖体又解离,可重新聚合参与另一条肽链的合成。
(四)转录与翻译的调控
1.真核基因转录调控
转录起始是真核基因表达调控的关键,参与转录调控的因素主要是顺式作用元件和转录因子,两者都包括正调控作用和负调控作用。
(1)顺式作用元件:
顺式作用元件是调控转录起始的DNA序列,能与特异性转录因子结合并影响转录水平的DNA序列,即包括启动子、增强子、沉默子和绝缘子。
1)启动子:
真核基因启动子一般位于转录起始点上游,包含若干具有独立转录调控功能的DNA序列元件,每个元件长为7~30bp。其中,核心启动子元件是保证RNA聚合酶起始转录所必需的。Ⅱ类启动子中最典型的核心元件是TATA盒(TATA box),通常位于转录起始位点上游-30~-25bp处,共有序列为TATAAAA,是基本转录因子TFIID的识别盒结合位点,控制着基因转录起始的准确性与频率。上游启动子元件包括CAAT盒(GGCCAATCT)、GC 盒(GGGCGG)、八联体元件(ATTTGCAT)以及距转录起始点更远的上游元件,相应的蛋白因子通过结合这些元件调节转录起始的频率影响转录效率。
2)增强子:
是一种能够提高转录效率的顺式作用元件,能使旁侧的基因转录效率提高100倍或更多。增强子中的功能元件是特异性转录因子结合DNA的核心序列,其长为8~12bp,以单拷贝或多拷贝串联形式存在。从功能上讲,没有启动子,增强子无法发挥作用,因此,增强子发挥作用需要有启动子存在。而另一方面,没有增强子,启动子往往不能表现活性或活性很低。
3)沉默子:
是基因表达的负性调控元件,能抑制或阻遏该基因转录的一段(数百bp)DNA序列。一方面能促进局部染色质形成致密结构,从而阻止转录激活因子与DNA结合;另一方面能够同反式作用因子结合,阻断增强子及反式激活因子的作用,从而抑制基因的转录活性。
4)绝缘子:
绝缘子一般位于增强子或沉默子与启动子之间,与特异蛋白因子结合可以阻断增强子对启动子的调控作用。
(2)转录因子:
真核基因的转录调节蛋白统称转录因子(transcription factor,TF),是转录起始调控的关键分子。以反式作用方式调节基因转录的TF称为反式作用因子(trans-acting factor),以顺式作用方式调节基因转录的TF称为顺式作用蛋白(cis-acting protein)。
依据功能特点,可将转录因子分为通用转录因子和特异转录因子两大类。通用转录因子是RNA聚合酶介导基因转录时所必需的辅助蛋白质,帮助聚合酶与启动子结合并转录,对所有基因都是必需的。特异转录因子是个别基因转录所必需,决定该基因表达的时空特异性。
1)转录因子的结构:
典型的转录激活因子含有DNA结合结构域(DNA-binding domain,DBD)和转录激活结构域(transcription-activating domain,TAD)、蛋白质-蛋白质相互作用结构域以及核输入信号结构域等。DBD的主要作用是结合DNA,并将TAD带到基础转录装置的邻近区域;TAD通过与基础转录装置相互作用而激活转录;蛋白质-蛋白质相互作用结构域介导TF之间,以及TF与其他蛋白质之间的相互作用,最常见的是二聚化结构域;核输入信号一般是转录因子中富含精氨酸和赖氨酸残基的区段。
2)转录因子激活基因转录起始:
转录因子激活基因转录起始的作用由TAD介导,主要有两种方式:①通过与通用TF相互作用而发挥转录调控功能;②通过辅激活因子而起作用。
3)转录抑制因子可抑制基因转录起始:
①通过干扰基础转录装置而发挥抑制作用,主要作用方式有三类:A.修饰RNA聚合酶Ⅱ的羧基末端结构域(carboxyl-terminal domain,CTD);B.抑制TATA结合蛋白与DNA的结合;C.抑制通用TF之间的相互作用。②通过抑制转录激活因子的功能而发挥抑制作用,主要作用方式有四种:A.阻止转录因子入核;B.与转录激活因子竞争DNA结合位点;C.封闭转录激活因子的TAD;D.促进转录激活因子的降解。
(3)RNA聚合酶Ⅱ CTD的磷酸化促进转录延长:
真核RNA聚合酶Ⅱ 大亚基的CTD是一段共有的7个氨基酸残基(YSPTSPS)的重复序列。CTD的磷酸化改变在转录的起始和延长过程中发挥重要作用。去磷酸化的CTD在转录过程中发挥作用,当RNA Pol Ⅱ完成转录启动后,在细胞周期蛋白依赖性激酶CDK7的作用下,CTD的Ser5和Ser7发生磷酸化,导致RNA聚合酶Ⅱ的构象发生改变,进而离开启动子,沿模板进行转录。进入转录延长期后,转录调节因 子 1(regulator of transcription 1,Rtr1)使 磷 酸化的p-Ser5和p-Ser7去磷酸化,而CDK9则使Ser2/Thr4磷酸化,直接进入转录终止期,再由TFⅡF相关CTD磷酸酶1(TFⅡ F-associated CTD phosphatase 1,FCP1)使 p-Ser2/p-Thr4去磷酸化,最终使CTD回到非磷酸化状态,RNA聚合酶Ⅱ进入新的转录循环周期。因此,CTD磷酸化修饰的动态变化可密切调控RNA聚合酶Ⅱ的转录循环周期。
2.真核基因的转录后调控
真核基因转录产生的大分子前体mRNA,需经正确加工后才能转变为成熟mRNA,并最终定位于细胞质而执行功能。多种因素参与调控mRNA的加工、转运、细胞质定位及稳定性等。
(1)mRNA 5'端的帽结构:
mRNA 5'端的帽结构可以增加mRNA的稳定性,该结构可以使mRNA不能被5'-核酸外切酶降解,延长mRNA的半衰期。
(2)mRNA 3'端的 poly(A):
mRNA3'端的 poly(A)结构防止mRNA降解,该结构可以使mRNA不能被3'-核酸外切酶降解,增加mRNA的稳定性。
(3)CTD:
RNA聚合酶Ⅱ的CTD磷酸化和去磷酸化修饰在RNA的转录后加工过程中发挥重要调节功能。
(4)剪接过程:
通过剪接可使前体mRNA转变为成熟mRNA,该过程受到多种因素的调控。剪接位点的选择受到许多反式作用因子和存在于前体mRNA中的顺式作用元件的调控。
(5)mRNA转运及细胞质定位:
mRNA在细胞核内完成转录和加工后,经核孔转输到胞质,需在特定的时间和地点发挥作用于蛋白质的生物合成。mRNA在核输出及胞质运输过程中,均以核糖核蛋白(ribonucleoprotein,RNP)复合体的形式进行。在到达目标区域后,其锚定也需相关的蛋白因子参与。调节mRNA定位的序列元件可为相应蛋白因子提供识别和结合位点。
(6)mRNA的稳定性:
mRNA半衰期的微弱变化可在短时间内使mRNA的丰度发生上千倍的改变,因此,调节mRNA的稳定性是调节基因表达的重要机制之一。①mRNA自身的某些序列可调控mRNA稳定性:参与调控mRNA稳定性的自身序列主要包括:5'端帽结构、5'-UTR、编码区、poly(A)尾、3'-UTR。②mRNA 的结合蛋白可调控mRNA稳定性:影响mRNA稳定性的RNA结合蛋白主要包括帽结合蛋白、编码区结合蛋白、3'-UTR结合蛋白等。③翻译产物可调控mRNA稳定性:有些mRNA的稳定性受自身翻译产物的调控。如在S期,组蛋白mRNA的合成达到高峰,所翻译的大量组蛋白与新合成的DNA组装成核小体。随着基因组DNA复制的减缓和终止,组蛋白基因的转录和翻译也减慢和停止。④无义介导的mRNA衰减系统可降解异常的mRNA:真核mRNA的质量受到严密监控,异常的mRNA将被监管系统发现并降解,这种降解是mRNA稳定性调控的重要内容。无义介导的mRNA衰减是真核细胞中广泛存在的一种保守性mRNA质量监控系统,可快速、选择性地降解含有提前终止密码子的异常mRNA,避免产生对机体有害的截短蛋白质。⑤某些非编码RNA可促进mRNA降解:某些非编码RNA(包括长链和短链非编码RNA)可通过促进mRNA降解而调控mRNA稳定性,进而调控相应蛋白编码基因的表达。一些lncRNA可竞争结合RNA稳定蛋白促进其降解;miRNA和siRNA可影响mRNA的稳定性,其作用是通过引导相应的RNA诱导的沉默复合体(RNA-induced silencing complex,RISC)与靶mRNA结合,促进mRNA降解。⑥多种其他因素可调控mRNA稳定性:除上述调控因素外,其他因素(激素、病毒、核酸酶、离子等)也能影响mRNA的稳定性。
3.真核基因的翻译调控
翻译水平上的调节点主要在起始阶段和延长阶段,尤其是起始阶段。翻译水平的调控主要是通过蛋白质与mRNA相互作用或干预蛋白质与mRNA相互作用而实现。
(1)翻译起始因子的磷酸化:
翻译起始的快慢在很大程度上决定着蛋白质翻译的速率,而真核翻译起始因子(eIF)的磷酸化修饰可调控翻译的起始。
1)eIF-2α亚基的磷酸化抑制翻译起始:
eIF-2由α、β、γ三个亚基组成,是典型的GTP结合蛋白,主要参与甲硫氨酰-起始tRNA(Met-tRNA)的进位过程,其α亚基的活性可因磷酸化(cAMP依赖性蛋白激酶所催化)而降低,导致蛋白质合成受到抑制。
2)eIF-4E及eIF-4E结合蛋白的磷酸化激活翻译起始:
eIF-4E为帽结合蛋白,其与mRNA帽结构的结合是翻译的限速步骤。磷酸化修饰可增加eIF-4E的活性,从而提高翻译效率。另外,eIF-4E结合蛋白可通过与eIF-4E结合而抑制eIF-4E的活性;而eIF-4E结合蛋白磷酸化可降低其与eIF-4E的亲和力,使eIF-4E释放而增加活性,加速翻译起始。
(2)RNA结合蛋白调控翻译起始:
有些RBP为翻译阻遏蛋白,在这些RBP中,有的可通过结合mRNA的5'-UTR而抑制翻译起始;有些RBP可与3'-UTR中的特异位点结合,干扰3'端poly(A)尾与5'端帽结构之间的联系,从而抑制翻译起始。
(3)翻译产物水平及活性的调节:
新合成蛋白质的半衰期长短是决定蛋白质生物学功能的重要影响因素,因此,通过对新生肽链的水解和运输,能控制蛋白质的浓度在合适的水平。蛋白质的特定修饰如磷酸化、甲基化、酰基化等可调节蛋白功能。
(4)miRISC结合靶mRNA抑制翻译:
miRNA的主要功能是调控翻译,且以负调控作用为主。但miRNA并不是通过与mRNA的简单互补结合而抑制翻译,而是通过与蛋白质结合形成miRISC对翻译过程产生抑制作用。
(5)lncRNA 可调控mRNA的翻译:
lncRNA调控翻译的机制复杂多样,可抑制翻译也可促进翻译。抑制翻译是通过促进mRNA降解进行调控,促进翻译通过促进mRNA与核糖体的相互作用调控。lncRNA也可通过结合mRNA防止miRNA的抑制作用。
4.X染色体失活
与性别相联系的基因表达调控具有特殊性,性别决定的染色体基础(男性XY,女性XX)导致大多数物种不同性别个体之间在基因拷贝数和组成上有所不同,因此性连锁基因的表达存在剂量补偿效应。剂量补偿是使X连锁基因的转录水平在不同性别之间达到平衡的过程。在生物界中,X染色体失活(X-chromosome inactivation)是哺乳动物实现剂量补偿的方式,其特殊性在于它调节的不是基因或基因簇,而是一整条染色体。
1961年,科学家Mary Frances Lron提出X染色体失活的假说(Lron假说),认为女性的两条X染色体在胚胎发育早期就有一条随机失活,因此女性体细胞的两条X染色体只有一条在遗传上是有活性的。该假说的要点如下:①失活发生在胚胎发育早期;②X染色体的失活是随机的,即父源或母源的X染色体失活是随机的;③失活是完全的,雌性哺乳动物体细胞内仅有一条X染色体是有活性的,另一条X染色体在遗传上是失活的;④失活是永久的和克隆式繁殖的,一旦某一特定的细胞内X染色体失活,那么由此细胞而增殖的所有子代细胞也总是这一个X染色体失活。
需要指出的是,虽然X染色体失活通常是随机的,但结构异常的X染色体,如有缺失的X染色体是优先失活的;另外,在X染色体平衡易位携带者个体中,通常是正常的X染色体优先失活。值得注意的是,虽然X失活是广泛的,但并不是完全的,失活的X染色体上基因并非都失去了活性,有一部分基因仍保持一定活性。
(1)X染色体失活的机制:
①X染色体失活中 心(X-chromosome inactivation center,XIC)是X染色体失活的主要调控区域,通过编码的多个长链非编码RNA调控,包括Xist、Tsix等结合到XIC上,进而富集更多的染色体修饰相关复合物,促进异染色质构象的形成。Xist是一个长链非编码基因,仅在失活X染色体中表达,其转录产物在X染色体上的覆盖引发了相应X染色体的失活。Xist IncRNA结合到失活染色体上是X染色体失活的关键一步。反义基因Tsix是Xist的一个重要抑制因子,参与调控X染色体的随机失活,其在XIC中的位置与Xist重叠但为反义方向转录。②X染色体失活的起始:二倍体卵细胞中存在计数机制,当X染色体的数量超过1时,就会有一条X染色体上的XIC区诱导Xist RNA的转录表达使其失活,同时,另外一条X染色体会被保护起来。X染色体数量确定以后,细胞会启动选择机制来决定哪条染色体失活。Xist RNA从XIC处转录并双向扩散,Xist RNA的聚集可以招募沉默复合物形成扩展失活状态的初始信号,并延展至整个染色体,导致异染色质化。③X染色体失活的维持:DNA的甲基化是维持X染色体失活的主要作用因素,缺失CpG岛甲基化的X染色体失活是不稳定的。组蛋白H3、H4的乙酰化不足也可能是维持失活染色体的重要因素。
(2)X染色体失活的逃逸:
人体的X染色体逃逸基因大多数在Y染色体上有同源序列,成簇地分布于Xp远端的拟常染色体区,这是X和Y染色体100%相同的区域。如基因XG(Xg血型基因)、MIC2(编码细胞表面抗原 CD99)、ANT3(指导ADP/ATP转换)等。
(3)X染色体失活与遗传病:
对于X连锁遗传病来说,男性为半合子,其全身细胞都为突变型,因此病情严重;对于女性杂合子,其体内部分细胞中带有显性基因的X染色体失活,另一部分是带有隐性基因的X染色体失活。因此,在X连锁显性遗传病中,女性杂合子患者的病症往往较男性患者轻,且表现程度不一,如低磷酸盐血症性佝偻病女性杂合子患者的临床病情通常较轻,有部分女性杂合患者仅有低磷酸盐血症而未出现明显的佝偻病症状;而在X连锁隐性遗传病中,一些女性杂合子携带者会表现出较轻的临床症状。