真核生物的启动子
(2010-04-28 22:05:03)
标签:
教育 |
分类: 系统生物学 |
由于真核生物中有三种不同的RNA聚合酶,因此也有三种不同的启动子,其中以启动子Ⅱ最为复杂,它和原核的启动子有很多不同:(1)有多种元件:TATA框,GC框,CATT框,OCT等;(2)结构不恒定。有的有多种框盒如组蛋白H2B;有的只有TATA框和GC框,如SV40早期转录蛋白,(3)它们的位置、序列、距离和方向都不完全相同,(4)有的有远距离的调控元件存在,如增强子;(5)这些元件常常起到控制转录效率和选择起始位点的作用;(6)不直接和RNA pol结合。转录时先和其它转录激活因子相结合,再和聚合酶结合。
Ⅱ类基因的启动子由核心元件和上游元件组成。核心元件包括TATA框和转录起始位点附近的启始子(initiator,Inr)。
在起始点一般没有同源序列,但mRNA的第一个碱基倾向A,另一侧翼由Py组成(在原核启动子的CAT起始序列也有这种情况),称为起始子(initiator),一般由P Y2CAPY5构成,位于-3~+5,可能提供RNA pol Ⅱ识别。无论TATA是否存在,Inr对于启动子的强度和起始位点的选择都是十分重要的。现已分离纯化了与Inr特异结合的蛋白质因子。
1.
TATA框合又称Hogness框,Goldberg-Hogness框,俚语称为金砖(Goldbrick),其一致序列是:T85A97T93A85A63A83A50,常在起始位点的上游-25左右,相当于原核的-10序列。但-10是不可缺少的,而真核启动中也有的缺乏TATA框。其作用是:(1) 选择正确的转录起始位点,保证精确起始,故也称为选择子(selector),当有的基因缺少TATA框时,可能由Inr来替代它的这一作用,如鼠的脱氨核苷转移酶(Tdt)基因就没有TATA框,但有17bp的Inr;(2) 影响转录的速率。TATA框的8bp的保守序列一般都是由A.T对组成,少数情况在其中的两个位点上由G.C对取代了A.T,可见它是较容易打开。当它的序列因发生突变和缺失而改变时就会影响它和酶的结合能力,从而影响转录的能力。在伴清蛋白基因中,当TATA框突变为TAGA后,转录效率大大降低。兔的珠蛋白基因当TATA框的保守序列ATAAAA人工突变为ATGTAA时转录效率会下降80%。人的b珠蛋白基因的ATAAA序列变为ATGAAA或ATAG/CAA时珠蛋白产量也会大大降低而出现地中海贫血症。
2.
上游元件包括CAAT box、GC box、等,它们的保守序列和结合的蛋白质因子也各不相
GC box的保守序列是GTGGGCGGGGCAAT,常以多拷贝形式存在-90处。在真生物和病毒的一些启动子中常存在GC框,如鼠二氢酸叶酸还原酶启动子,猴基因组中的双向启动子,SV40,疱疹病毒等基因的启动子中,可被转录因子SPI所识别。它的作用也是控制转录效率。
还有其它的一些UPE,如八聚体(Octamer),KB,ATF等
3.
(1) 增强子
远端调控区较常见的是增强子(enhomcer)。至少在有时候增强子的存在可以增强启动子的转录活性。它是在1981年由Benerji,Rusconi小组和Chambom等发现的,又称远上游序列(far upstream seguence)。其特点是:① 具有远距离效应。常在上游-200bp处,但可增强远处启动子的转录,即使相距十几Kb也能发挥其作用;② 无方向性。无论在靶基因的上游,下游或内部都可发挥增强转录的作用;③ 顺式调节。只调节位于同一染色体体上的靶基因,而对其它染色体上的基因无作用;④ 无物种和基因的特异性,可以接到异源基因上发挥作用,如将SV40的增强子接到兔β-珠蛋白基因前,引入Lela细胞,此珠蛋白基因转录增强200倍。⑤ 具有组织的特异性。 SV40的增强子在3T3细胞中比多瘤病毒的增强子要弱,但在Hela细胞中SV40的增强子比多瘤病毒的要强5倍,抗体基因的增强子只有在B淋巴细胞中才起作用。增强子的效应需特定的蛋白质因子参与。⑥ 有相位性。其作用和DNA的构象有关。⑦ 有的增强子可以对外部信号产生反应。如热体克基因在高温下才表达。编码重金属蛋白的金属硫蛋白基因在镉和锌存在下才表达。某些增强子可以被固醇类激素所激活。
病毒SV40的增强子是最先被描述的,它由2个72bp的重复序列组成。位于上游-200bp处。每个72bp的单元中都有A、B两个功能域。它们在一起共含有5个序列元件(GTⅡ,GTI,Sph.11,sphI和P),这5个元件对转录来说是很重要的。不同的序列模块是作为特殊转录因子识别序列。增强子的某些结构特征和启动子相似:如它们都是被反式一作用因子(rtams-acting factors)所识别的顺式-作用序列(cis-acting seguence),只不过增强子的作用距离比启动子长。
增强子为什么具有远距离作用呢?为了解这个问题前后曾有三种不同的假设:(1)拓朴效应;(2)滑动模型;(3)成环模型。拓朴效应说认为增强子的作用是诱导染色质结构变化,使核小体产生DNaseI敏感区。SV40的增强子区和免疫球蛋白基因的增强子区都发现存在DNase1的高敏感区。增强子区域核小体常不能很好装配,结构松驰;在SV40的增强子区域存在左旋的Z-DNA区,也有助于双螺旋的打开,使和转录有关的蛋白质因子和DNA结合,然后再延着DNA滑向启动子;成环模型认为增强子通一些蛋白质因子的介导可与远距离的启动子结合,使DNA形成了一个环,从而促使远距离的启动子的转录。这一模型已得到普遍的认可。一些实验的证据表明免疫球蛋白K链基因的增强子可以作用两个距离不同的启动子(分别为440bp和2.7Kb),而作用是相同的。若是按滑动模型,对距离的启动子的作用应高于远距离的启动子。但事实并非如此。从消耗能量的角度来说,这距离的滑动对生物是不利的,在进化中会受到选择的压力。成环模型也符合染色体的侧环模型和核基质的调控理论(见第十七章)也就是说DNA的特殊序列可以和核基质结合形成侧环,在某些细胞中某些基因通过环的形成命名样强子区和启动子区相互靠近,使这些基因能得以表达,而另一些基因,显示了基因表达的组织特异性。看来环的形成主要是两种因素:(a)某些蛋白质因子的介导;(b) 和核基质特异的结合图。
(2)减弱子(dehancer)
在某些基因的上游远端或下游远端具有负调节序列,其作用不受距离和方向的影响,叫做减弱子。如C-mos基因上游0.8或1.8Kb处有一序列,使C-mos不易被反转录病毒的长末端重复序列(LTR)所激活。在C-myc基因的3′端也存在着减弱子。
(3)
在酵母交配型转换的盒式模型中,左右两个沉默框(HML和HMR见17,23章)都不表达,此是由于在这两个框盒上游1.5Kb处都有一个E片段,它可和阻遏沉默框盒表达的蛋白SIR(1-4)(silent mating tyne information regulation)结合,起抑制作用,故称静息子,可作用2.5Kb远的启动子。
(4)
UASs是酵母中远上游序列类似于增强子。它仅影响转录程度,对位点选择不起作用。和增强子不同的是它有方向性,不能在启动子的下游起作用。它结合的转录因子是GCN4和GAL4,识别位点为ATGACTCAT。
二)RNA pol Ⅱ的转录起始
第一步是原称为TFⅡD的转录启动因子和TATA框结合形成复物体,为RNA pol Ⅱ指明结合位置。现在已和TFⅡD含有种蛋白,一种是识别TATA框的TBP(TATA-binding protein),是30KDa的小蛋白。另一些亚基称为TAFs(TBP结合因子,TBP-associated factors)。有的TAFs是和TBP等当量的。而另一些TAFs存在量较少。很可能TFⅡDs含有不同的TAFs来识别不同的启动子。
这种观点认为TBP和不同的TAFs结合可以使其它的聚合酶识别启动子。TFⅢB是用于内部polⅢ启动子,SLi 是用于polI启动子,但这两者都被分成TBP和特殊TATs结合的一种成份。任何单个的TBP分子,其本身并不是对所有启动子都是必需的。但实际是和TAFs结合,不断地用于特殊的启动子。TBP必需具备在各种启动子上和这种因子或聚合酶相互作用结合的能力。在酵母中TBP基因突变性会影响到不同类型启动子的转录。
|
人类Ⅱ型基因的转录因子 |
||
|
因子 |
分子量 |
功能 |
|
RNAPolⅡ |
≥10K |
依赖模板合成RNA |
|
TFⅡA |
12, 19, 35K |
稳定TFⅡD和DNA的结合,激活TBP亚基 |
|
TFⅡB |
33K |
结合模板链(-10~+10),起始PolⅡ结合,和TFⅡE/F相互作用 |
|
TFⅡD |
(TBP, 30K) |
TBP亚基识别TATA,将聚合酶组入复合体中,TAFs识别特殊启动子 |
|
TFⅡE |
34K(β),57K(α) |
结合在PolⅡ的前部,使复合体的保护区延伸到下游 |
|
TFⅡF |
38, 74K |
大亚基具解旋酶活性(RAP74),小亚基和PolⅡ结合,介导其加入复合体 |
|
TFⅡH |
|
具激酶活性,可以磷酸化PolⅡC端的CTD,使PolⅡ逸出,延伸 |
|
TFⅡI |
120K |
识别Inr,起始TFⅡF/D结合 |
|
TFⅡJ |
|
在TFⅡF后加入复合体,不改变DNA的结合方式 |
|
TFⅡS |
|
RNA合成延伸 |
TBP作为第一个和DNA接触的因子十分引人注目,有是它被看成是一种“束缚”因子(commitment factor)其实是和RNA pol Ⅱ结合,使启动子转录,它起到介导的作用。由于TATA框离转录起始位点的距离是固定的,识别它对RNA聚合酶来说是重要的。TBP在启动上对各种聚合酶所起的一个相同的作用是将它们组入转录复合体中。
TFⅡA含有几个亚基(在酵母中有2个,在哺乳动物中有3个),当它加入复合体中时,TFⅡD所保护的DNA区域就延伸更上游的区域。它可能通过解除TAFs的阻遏作用而激活TBP,它的参与使TFⅡD和TATA框结合得更稳定
TFⅡB分子量为33Kda,它在起始点邻近区域,从-10到+10可以部分地保护模板链在TATA框下游与DNA松散结合。形成复合物,和DNA双链结合是不对称的,它还可以使TFⅡE/ⅡF相互作用。
TFⅡF含有2个亚基,大亚基RAP74,具有ATρ-依赖性DNA解旋酶活性,它和起始时DNA链的熔解有关。它的小亚基是RAP38,和细菌的σ因子有部分同源,紧密地和RNA pol Ⅱ结合。介导polⅡ和其它蛋白结合转录成复合体。TFⅡF-polⅡ和复合体连接时,与TFⅡB的相互作用是重要的。
RNA PolⅡ结合位点在模板链上达到下游+15,在非模板链上达到+20,其长度贯穿了整个复合体 ,上游也被其保护了。
TRⅡE结合在pol的前部,使复合体的保护区延伸到下游双链的+30处。
TRⅡH和 TRⅡJ在TRⅡF之后也加入复合体中,但并不改变DNA的结合方式。TFⅡH具有激酶活性,可以磷酸化RNA pol Ⅱ尾巴上的CTD,CTD的磷酸化使polⅡ从转录因子中释放出来,这样就能离开启动子开始延伸。
这一起始过程和细菌RNA pol催化的反应是相似的。RNA pol的结合产生了闭合复合体。在最后阶段双链打开产生开放复合体。这种转变是和下游位点复合体体影响的增加有关。多半是由于TFⅡ因子的释放有关。起始反应的双链分离阶段是需水平解ATP的,可能要释放某些转录因子。在基本的因子和polⅡ的相互作用中看来TBP和酶尾部的CTD之间的作用也是重要的。
在没有TATA框的启动子上起始何发生呢?这种起始同样需要一些基本的转录因子,其中也包括TFⅡD。TFⅡD可能带有一个或多个TAFs来直接识别Inr,并与之结合。现在还不清楚在和TATA结合中TFⅡD怎样发挥其作用。Inr序列可能作为一种位置元件,让转录因子结合于其上,且锚这种复合体。TFⅡD看来必须以某种其它方式进入复合体而不结合在TATA框上。在这些启动子上TBP的功能很象在pol的启动子上和polⅢ的内部启动子上。
很多的基本因子含有多种亚基,所以多数的分子量是很大的,可能涉及到约20多种肽,总分子量达到500KDa,polⅡ约有10个亚基分子量也有约500Kda,看来RNA Pol的起始是涉及到非常大的复合体。
PolⅡ起始复合体提供了一个和原核转录有趣的对照。细菌的RNA pol很容易和DNA结合;σ因子对于起始于必要的,但无助于延伸,因起始后它就被释放出来了。真核的polⅡ只有在起始因子和DNA结合后才和启动子结合。这些因子的作用类似σ因子,使聚合酶识别启动子上的特殊序列。但已进化得比较独立。
三) RNA polⅠ启动子
RNA polⅠ的启动子变化最小,RNA pol仅从单一类型的启动子转录rRNA基因,转录本含有大rRNAs和小rRNAs的序列,经过加工再将它的释放出来。
这种启动子描述得最清楚的是人类细胞中的,它由两部分序列构成,一是核心启动子(core promoter)或核心元件(core element),位一起始位点的前后,从-45到+20,负责转录的起始。另一部分是上游控制元件(upstream,control element UCE),它从-180延伸到-107,此区可增加核心元件的转录起始的效率。这两个区域都有一个特殊的成份,就是G.C丰富区(G.C含量达85%)。
RNA pol
Ⅰ需要2种辅助因子:UBF1(上游结合因子1)结在核心动子相关的特异序列中和UCE上。SL1因子,它本身对这种启动子来说并非是特异的,但一旦UBF1和DNA结合了,那么聚合酶才能和核心启动子结合起始转录。很可能是这些因子结合在核心启动子上直接与RNA
polⅠ相互作用,但还不清楚在UCE上的因子如何刺激核心启动子的起始。在RNA polⅡ启 动子中远
距离作用是一个重要的特点,研究得较为深入,但不知道RNA
polⅠ是否具有相同的机制。
UBF1是一个单链多肽,它可以和核心区UCE的G.C丰富区结合。UBF1和RNA pol可在异源模板上发挥功能,如鼠的这种蛋白质因子和polⅠ能识别人类的基因。但SL1在起始转录时具有种的特异性。
LS1含有4个蛋白,其中之一称TBP,也是polⅡ和polⅢ起始时所需的一种蛋白质因子。可能在聚合酶起始后不久就发挥作用。这一和pol有关的重要特点是TBP在种间是保守的,但似乎并不具有种的特性,也并不一定要特异地和G.C丰富区结合。因此可能和DNA的结合的种的特异性是SL1另一些组分的功能。TBP可能和RNA pol相互作用,和RNA pol的一个共同的亚基或一个功能域相结合。
SL1的行为与细菌的因子相似,作为复合体的一个成员,若分开来的话,它单独是不能和启动子特异结合的。但和其它组分结合起来就可以结合在启动子的特异区域。其初步功能可能是保证RNA聚合酶能位于起始位点的合适位置上。简而言之其功能是使TBP和其它蛋白质结合,为polⅡ和polⅢ提供转录因子。三种聚合酶起始的共同特点是依赖TBP和蛋白质结合构成的一种“位置”因子,这种位置因子对不同类型的启动子来说是特异的。
非洲爪蟾的pol I启动子并不分两个区域,它从+1到-141,其序列具备高度的种的特性,RNA polⅠ在体外只能从密切相关的转录系统中转录rRNA基因。种的特异性是由转录因子决定的。
(四) Pol Ⅲ 启动子的结构及起始
人们通过转录起始区不同位点的缺失或突变来研究各种启动子的结构和功能。RNA pol Ⅲ启动子一般分成基因内启动子和基因外启动子两类它们是由不同的转录因子以不同的方法来识别的。5S RNA和tRNA都属于RNA polⅢ启动子,但它们比较特殊,位于起始位点的下游的转录区内,因此也称为下游启动子(downwtream promoter)或基因内启动子(intragenenic promoter)或称为内部控制区(internal contron regin ,ICR)。snRNA基因的启动子和常见的启动子一样位于起始位点的上游,在以上两种不同的情况中都有特序列存在,这些序列由转录因子识别而并不直接和RNA聚合酶结合。正是这些构成了特殊的pol Ⅲ 启动子。
在非洲爪蟾的5s RNA基因启动子在未鉴别出前,人们都以为它在起始位点的上游,缺失分析表明,当上游序列全部被切除后5SRNA的产物仍照样合成。当缺失在基因内发生时仍可转录,只不过产物也缺少一段。但缺失发生在+55区域时,就不再转录。因此可以推测启动子位于起始点下游+55,可能由于polⅢ起始转录要有一个固定的距离。当缺失发生在基因末端,但保留80bp序列时转录不受影响。但当缺失发生在80bp区域转录就会停止,表明启动子的下游分界域在+80。
因此5SRNA的启动子是在基因中的+55~+80之间。含有这个区域的DNA片段就可在其上起始转录,起始点在+55的更上游的位置。
用突变分析表明有两种类型的内部启动子,每一种都由两部分构成。这是两个短的序列元件中间间隔着一个可变化的序列。比较一下这两种类型的内部启动子表明:Ⅰ型内部启动子含有两个分开的boxA(T G G C N N A G T – G G)和boxC(C G G T C G A N N C C)序列。而Ⅱ型内部启动子含有两个分开的boxA和boxB。Ⅱ型内部启动子中boxA和boxB之间的距离较宽。通常有功能的此类启动子中的两个box就不能紧紧连在一起。但上游启动子正是这样。
内部启动子中的起始的各个阶段,需要涉及3个起始因子,TF Ⅲ A已被克隆,是一种合9个锌指的蛋白(Zinc finger protein)。TF Ⅲ B含有TBP和两个其它的蛋白。TFⅢC是一种大分子蛋白复合物,至少有5个亚基,分为两个功能域τA(300K)
RNA pol Ⅲ 启动子的转录因子的结构和功能
|
因子 |
结构 |
功能 |
|
TF Ⅲ A |
38Kda,有9个锌指 |
结合于1型内部启动子(5sRNA基因)的C框,使Ⅲ C结合在C框下游,辅助Ⅲ B定位结合 |
|
TF Ⅲ B |
含TBP和另外二种蛋白 |
定位因子,使Pol结合在起始位点上 |
|
TF Ⅲ C |
含τA和τB,有5个亚基 |
τB结合Ⅱ型内部启动子(tRNA基因)的B框,起增强子的作用。ΤA结合A框,起启动子的作用;辅助Ⅲ B定位结合 |
|
TBP |
是Ⅲ B,ⅡD,SL1的亚基 |
和特异DNA序列及RNA Pol结合,使Pol结合在正确的位点上 |
|
TⅡD |
含TBP亚基 |
结合TATA框,确定选择PolⅢ |
|
PBP |
次近端结合蛋白 |
可能和ⅡD一道辅助Ⅲ B定位结合的另一途径 |
和τB,分别和2型内部启动子(tRNA基因启动子)的A框和B框结合。B框相当于增强子的作用,A框相当于启动子的作用。在Ⅰ型内部启动子中(5sRNA基因启动子)TFⅢA结合在C框上,使TFⅢC结合在C框下游。在Ⅱ型内部启动子中TF Ⅲ C的结合使TFⅢ B依次结合在起始位点的近上游。TF Ⅲ B结合在起始位点上并和TF Ⅲ C相连。
这些因子作用的突出特点是当将TF Ⅲ A和 Ⅲ C从启动子上除去(在体外用高浓度的盐)不影响起始反应。只要TFⅢB仍结合在起始点的附近就能使RNA pol正确地结合在转录起始点。因此只有TF Ⅲ B才是pol Ⅲ 所必需的起始因子。TF Ⅲ A和TF Ⅲ C仅是一种装配因子(assembly factor),它们的作用是辅助TF Ⅲ B结合到正确的位置上。这样就解释了下游启动子怎样使聚合酶结合到上游位点。
TF Ⅲ B的功能是作为一个“定位因子”(positioning factor)负责RNA pol结合正确位置上。就像polⅠ中的SL1那样。功能类似于原核的σ因子。它本身缺乏和DNA的结合能力,但可以和结合在DNA上的其它蛋白结合。前面已说过TF Ⅲ B含有TBP,而SL1也含有TBP,它可能作为TF Ⅲ B的一个亚基,直接和RNA相互作用。
内启动子虽然赋于这些基因具有转录的能力,但起始点也具有一定的影响。若改变起始点上游区域就会改变转录效率。看来内部启动子的作用是提供识别;起始位点的作用是控制转录效率。
在第三种polⅢ启动子有3个上游元件,这些元件仅在snRNA启动子中被发现,有的SnRNA是由polⅡ转录,有的是由polⅢ转录。这些上游元件在一定程度上和polⅡ及polⅡ的启动子相似。TATA元件看来和特异的聚合酶结合。
PolⅢ上游转录起始发生在起始点上游的一个很短的区域中,且含有TATA框。次近端序列元件(proximal sequence element,PSE)和八聚体OCT元件的存在大大增加了转录效率,结在这些元件上的转录因子相互协同作用。
TATA元件是供TBP识别的,TBP亚基本身识别DNA序列,其结合的其它蛋白有的可和polⅢ结合,有的对polⅡ特异,这就可以解释为什么polⅢ和这些启动子特异结合。TBP及其结合蛋白的功能是使polⅢ正确地结合在起始位点上。TFⅡD也含有TBP可和TATA的结合,促使polⅡ起始位点附近。
TBP是RNA pol Ⅱ起始的一套因子中的重要成分,它是定位因子的关键成份,通过不同机制结合在各种类型的启动子上。无论哪一种启动子,TBP都是起始复合物的组成部分,与RNA pol的相互作用中发挥共同的作用。
在RNA pol Ⅲ启动子上的这些因子的功能中有一种潜在的协同效应。TFⅢB在启动子上结合在pol的前方,本身并不能和DNA结合。需要依靠ⅢA、ⅢC协助,形成一种前起始复合体(preinitiation complex)结合在特异位点上,然后再直接和pol结合。启动子与RNA pol Ⅲ识别的这种机制显示出起始点的建立对转录起始是十分重要的。
RNA pol Ⅲ 对任何特殊序列都没有内在的亲和性,它正好和位于起始点上游的一些起始因子相结合。使其正确定位。在1型和2型内部启动子中,含有TBP亚基的TFⅢB就是起到这种作用,提供了位置信息。对于pol Ⅲ 的上游启动子,转录因子是识别上的位点形成含有TBP的复合体,供polⅢ识别。这样不论启动子特异序列的位置如何,为了和RNA pol Ⅲ的直接结合,它们总是有序地结合在起始点附近。

加载中…