第五章 蛋白质结构与功能-转录因子
分化是不同基因表达的结果。在正常情况下,一个个体的各种细胞类群总是按照一定的计划不断进行严格的调控,关闭某些基因,开启另一些基因,使个体发育得以顺利进行,所以不同细胞的基因表达依类型不同和所处发育阶段的不同而异。而决定基因开关的那些调节蛋白质,即转录因子可称为生物体分化发育的分子开关。
第一节 转录因子的结构
转录因子(Transcription
Factor,TF)也称反式作用因子,是指那些具有同真核生物启动子特定DNA序列结合活性的蛋白质分子,或者是具有已知DNA结合域结构特征的蛋白质分子。
从蛋白质结构来分析,转录因子一般含有4个功能区,即DNA结合域,转录调控域(包括激活和抑制域),寡聚化位点以及核定位信号。但是不同的转录因子可能缺少某一结构域。
1.1.转录因子常见基本结构
转录因子的功能结构域从蛋白总体分离出来后,无论是单独作用还是同其它来源的蛋白连接后,仍保持原有的功能(如DNA结合活性和转录激活活性)。
1.1.1 DNA结合域
DNA结合域,是指转录因子识别顺式作用元件并与之结合的一段氨基酸序列。
DNA结合域通常由60-100个氨基酸残基组成。DNA 结合功能域带共性的结构主要有 :
① HTH 和 HLH 结构。
②锌指结构。
③亮氨酸拉链结构。
在植物的转录因子中,比较典型的DNA结合域有bZIP(碱性亮氨酸拉链)结构域、锌指结构域、MADS结构域、MYC(碱性螺旋一环一螺旋)结构域、MYB结构域、Hemeo结构域、AP2/EREBP结构域、WRKY结构域等。转录因子DNA结合域的特定氨基酸序列决定它们与顺式作用元件识别及结合的特异性。
1.1.2 转录调控域
同一家族转录因子的主要区别,在于它们的转录调控结构域各不相同,转录调控结构域包括转录激活域(transcription
activation domain)和转录抑制域(transcription repression
domain)两种,它们决定转录因子功能的差异。
典型的植物转录激活域是与DNA结合域分开的,该结构域常见有4种特征类型:富含酸性氨基酸,富含脯氨酸,富含谷氨酞胺和富含丝氨酸/苏氨酸。
1.1.3 核定位信号
核定信号(NLS)是转录因子中富含精氨酸和赖氨酸残基的核定位区域,转录因子进入细胞核的过程受该区域的调控。
1.1.4 寡聚化位点
寡聚化位点是不同转录因子借以发生相互作用的功能区域。
1.2.转录因子的种类
由于许多转录因子能异二聚体化,从而极大地增加了转录调节的多样性和特异性。
在真核生物中,mRNA的转录起始是一个十分复杂的过程,在基因转录表达中起调控作用的顺式作用元件,由启动子和DNA调节序列组成。基因的转录起始涉及众多的转录因子,这些转录因子可以分成两类:
①普遍性转录因子 (general transcription
factor,非特异性转录因子或基本转录因子):是RNA聚合酶结合启动子所必需的一组因子,为所有mRNA转录启动共有。
②特异性转录因子(specific transcription
factor):也是一种DNA结合蛋白。是能够选择性调控某种或某些基因转录表达的蛋白质因子。。
第二节 作用方式特点和其研究方法
转录因子的作用特点:
①同一DNA顺式作用元件可被不同的转录因子所识别;
②同一转录因子也可识别不同的DNA顺式作用元件;
③ TF与TF之间存在相互作用;
④当TF与TF,TF与DNA 结合时,可导致构象改变;
⑤TF在合成过程中,有较大的可变性和可塑性。
DNA芯片技术是研究转录因子的方法之一,它是功能基因组研究的核心方法,也称DNA微列阵技术(DNA
microarray),是将不同序列的核酸样品高密度压印在载体上,然后将各种可能的转录因子与之进行结合,通过分析结合信号来研究二者相互作用的特点。
第三节 一些常见的植物转录因子
第四节 动物中的转录因子——MyoD
MyoD基因的全称是myogenic differentiation
antigen(成肌分化抗原),是以其命名的一个调控成肌细胞分化的转录因子家族的重要成员。
确定了人的myoD家族的四个成员myoD、myogenin
(MYF4)、MYF5和MRF4。它们在结构上类似的区域就是与DNA结合并且激活成肌作用的区域。从体节细胞分化为成肌细胞时需myoD和myf
5两种蛋白,
而从成肌细胞合并发育分化为成熟的骨骼肌细胞则依赖于myogenin基因。细胞融合前只有myoD及myf5基因表达,myogenin基因只有在细胞融合发生后表达,且受myoD及myf
5表达的诱导。
myoD家族蛋白结构上的最大特点是含有b-HLH结构域,所以从结构上看,它们属于HLH转录因子超家族成员。其中Basic结构域是HLH螺旋结构的延伸,也是这一家族蛋白与DNA相互作用的区域,而HLH螺旋结构则是与许多其他因子相互作用的位点,是调控的重要区域。
在哺乳动物中myoD能诱导肌细胞特异性基因转录,与肌肉发育有紧密的相关性。myoD家族蛋白在形成同源及异源二聚体后,可与基因调控区中的CANNTG序列(又称E
box)相结合,通过DNA-protein相互作用, myoD构象改变从而诱导肌细胞特异性的基因转录。
第五节 热休克转录因子——HSF
迄今,热休克蛋白HSP的结构及其在热应激反应中的功能已较为清楚,其还可作为“分子伴娘”(Molecular
charperone)参与其他蛋白的折叠。热休克基因表达的调节主要发生在转录水平,热休克基因的表达受到一个重复DNA序列的可逆的顺式负调节(Negative
cis-acting control)。
热休克转录因子HSF。
热休克元件(HSE)。
5.1
HSF的类别与功能
HSF在热应激反应中的主要功能,是在热休克基因的表达过程中与相应启动子结合,启动基因的转录过程,最终促进HSP的表达。
5.2
HSF的结构
HSF结构却极为相似,共同具有一个极为保守的核心区域——
DNA结合区域(DNAbindingdomain)和三聚区域(Trimerizationdomain)。
DNA结合区域靠HSF的N-末端,位于HSF最保守的区域中,具有 DNA结合蛋白特征性的螺旋-转角-螺旋结构基元(
helix-turn-helix
motif),由3个螺旋(H1、H2和H3)和4个反向平行的β-片层(β-sheet)(β1、β2、β3和β4)组成。
HSF的DNA结合区域与DNA结合的部位起始于H1的N端后数个氨基酸处。终止位置对不同的HSF并不一致,但多数终止位置位于β4末端之后的16个氨基酸处。这16个氨基酸的功能,一方面是通过与疏水核心的相互作用,在空间结构上封闭DNA结构区域的一个侧面;另一方面,是使HSF三聚体中各HSF单体的DNA结合区域相互协调,以获得对热休克元件(HSE)的高亲和力。
DNA通过主沟与HSF结合,具体结合位点就是DNA上的
HSE。HSF能识别HSE上特异性的“-nGAAn-”结构,HSF单体与“-nGAAn-”结构以1:1的比例结合。HSE上“-nGAAn-
”结构的数目对HSF与HSE亲和性有很大的影响。一个完整的HSE结构上通常有3个“-nGAAn-”结构,而完整的
HSF也是以三聚体的形式与HSE结合,这样的结合具有最大的亲和力。
许多物理学与遗传学证据都表明,DNA结合区域螺旋-转角-螺旋结构上的第3个螺旋(H3)起识别HSE上
“-nGAAn-”结构的作用。H3通过其极性及阳性氨基酸残基在溶液中形成一个典型的双岐性螺旋(Amphipathic
helix),与DNA通过离子键相互作用,但具体的机制尚不清楚。
当HSF活化时,相互间需通过三聚区域结合形成HSF三聚体。相对于DNA结合区域,三聚区域位于HSF的中部。三聚区域的特征性结构是3个疏水七氨基酸重复序列(Hydrophobic
heptad repeat array)。这3个序列由数目不等的七氨基酸重复(Heptad
repeat)构成。第一个序列较长,有5~6个七氨基酸重复;第二和第三个序列较短,且基本上重叠在一起,前后只差一个氨基酸;第一个序列与后两个序列之间由QQQ基元(QQQ
motif)隔开。(注:Q即谷氨酰胺残基)
每个七氨基酸重复单位的第一和第四个疏水氨基酸残基,是螺旋型卷曲螺旋结构(Helical coiled-coil
structure)所特有的,可用于形成亮氨酸拉链(Leucine
zipper)。但具有亮氨酸拉链的蛋白通常形成同二聚体或异二聚体,像HSF这样形成三聚体的非常少见。
除DNA结合区域与三聚区域外,促进热休克基因转录的活化区域(Activator
domain)也是HSF较重要的结构之一,但活化区域与上述两个结构区域不同,其物种间的同源性不高,位置也不很确定。
5.3
HSF活化过程
多种内、外界刺激因素均可活化HSF。HSF 通过以下3个步骤被活化:
(1) HSF 由单体形式变成磷酸化的三聚体形式被激活
(2) 三聚体与HSE结合
(3) 转录活化区域开放,促进HSP转录
第六节 一些转录因子的实例
6.5 核转录因子κB(NF-κB)
核转录因子κB(NF-κB)是一类在动物细胞中广泛表达的转录因子,能与某些基因的增强子上κB位点结合,并启动、促进相应基因转录。NF-κB是参与应激反应的蛋白质基因转录的调控因子。
有生理功能的NF-κB是由P50和P65两个亚单位构成的异源二聚体。其主要生理功能之一是通过诱导凋亡抑制基因的转录,拮抗细胞凋亡的发生,几乎存在于所有细胞中。
6.6 Spl
Spl是序列特异性的DNA结合蛋白,可调控某些启动子中富含GC序列的细胞和病毒基因的转录过程。
第七节 人工转录因子
转录因子是真核表达调控中非常重要的一类反式作用因子,通常由DNA
结合结构域与效应结构域两部分组成,研究发现这两个结构域可以各自独立发生作用。
基于转录因子的这种结构特点,可以人为地选择针对特定序列的DNA 结合结构域与具有特定作用的效应结构域构建人工转录因子。
目前人工转录因子的DNA结合结构域多为C2H2型锌指结构,每一个锌指单元由大约30个氨基酸组成,识别DNA双螺旋大沟中相连的3bp序列,并可通过氢键作用与相应的碱基结合;多个锌指可以串联成簇,从而识别并结合较长的DNA序列区域。
常见的人工转录因子的效应结构域有激活结构域以及抑制结构域,不同的效应结构域赋予人工转录因子不同的功能。
7.1
人工转录因子的结构
早期的人工转录因子只是简单地将某种已知转录因子的DNA 结合结构域与另一种已知转录因子的效应结构域组合在一起所得到的融合蛋白。
7.1.1 DNA结合结构域
目前在人工转录因子的设计中使用的DNA 结合结构域根据其构成分为非蛋白结构模块与蛋白结构模块两大类。非蛋白结构的DNA
结合结构域包括三链形成寡核苷酸(triplex- forming oligonucleotides,
TFOs),肽核酸(PNAs)以及聚酰胺(polyamides)等。TFOs与PNAs都是通过与靶序列形成三链而识别特异序列的;而聚酰胺则是通过与DNA的小沟结合来进行序列识别的,有人等已经设计出了可以特异识别4bp序列的聚酰胺分子。
蛋白结构的DNA结合结构域包括螺旋-转角-螺旋结构、类固醇受体以及锌指结构等,这些结构是天然的转录因子中经常出现的组成部分,其中锌指结构以其小巧灵活,结构独特而备受关注。
C2H2
锌指结构是真核细胞中最常见的DNA结合模体(motif)。多个锌指单元可以串联成簇。识别更长的DNA序列。
锌指蛋白Zif268包含3个锌指单元,通俗地讲,就是3根手指。C2H2锌指与DNA作用的特点:每一个锌指单元(即每个手指)的α螺旋伸入DNA的大沟中,通过α螺旋外侧的氨基酸来识别DNA双螺旋大沟中的相邻的3~4bp序列,并可通过氢键作用与相应的碱基结合。
相对于其他的DNA结合结构域,C2H2锌指有很多的优点。例如,许多DNA结合结构域由于自身是对称或者二聚化的结构而只能识别对称序列,而C2H2锌指则可以识别非回文序列;并且由于可以多个锌指单元串联,C2H2锌指对于其识别序列的长度和结构没有太多的限制,仅仅需要改变几个关键位点的氨基酸,就可以赋予锌指新的识别特性。
7.1.2
效应结构域
目前的人工转录因子的设计中通常都要加上不同的效应结构域,以赋予人工转录因子不同的功能。
7.1.2.1
激活结构域
常用的激活结构域有来自NF-κB的p65亚基(288-548aa)以及来源于单纯疱疹病毒(HerpsSimplex
Virus)的VP16等等。利用VP16的413-490位氨基酸部分,就可以很有效地激活(上调)基因的转录;有文献表明VP16的437-447位氨基酸DALDDFDLDML也可以产生明显的激活作用;再缩小至7~8个氨基酸,或者DDFDL5个氨基酸,仍然有很强的激活作用。
另外,许多被称为AH(amphipathic helix)的模拟天然激活区域的15aa人工肽也被用在人工转录因子的构建中。
近年来还有人发现形成发卡的RNA分子对于基因的转录也能产生一定的激活作用。
7.1.2.2 抑制结构域
常用的抑制结构域有转录因子KOX1的KRAB(Krüppel-associated
box)结构域和SID(Sin3ainteraction domain)结构域。
KOX1是一种重要的转录抑制因子,是kox1基因的产物。KOX1的第1~75氨基酸就具有全部的转录抑制活性,这75个氨基酸在不同的物种之间是具有高度同源性的序列,称为KRAB域。KRAB或者SID与锌指融合以后能够以一种不依赖距离和方向的方式来调控哺乳动物的启动子。
另外,小的肽段诸如WRPW和CCVC也能起到类似的抑制基因转录的作用,其中WRPW通过招募高度保守的抑制因子Groucho(在人类蛋白中被称为TLE)而达到抑制基因转录的效果。
7.2
获得特异识别DNA 序列的锌指蛋白
人工转录因子的序列特异性是靠其DNA结合结构域(最常用的是锌指结构)来实现的;因此,获得特异识别DNA序列的锌指蛋白是构建人工转录因子时最重要的工作。
7.2.1 文库筛选
目前直接设计所得到的特异性最好的三锌指蛋白也只是可以特异地识别9bp靶序列中的7个碱基位点,远未达到实际应用的要求。
人们更加倾向于使用从文库中筛选的方法来得到能够特异识别自己感兴趣的DNA序列的锌指结构。这样的锌指文库目前有噬菌体展示系统、酵母单杂交系统、细菌双杂交系统以及哺乳动物细胞筛选系统等多种。
7.2.1.1
噬菌体展示策略
噬菌体展示系统在许多蛋白与多肽的研究中都已经成为一种强有力的手段;在锌指的筛选方面,由于筛选中是利用DNA片段来富集文库中能够特异结合该DNA片段的锌指,因此与常见的抗体筛选略有不同。
目前常见的噬菌体展示锌指文库都是以Zif268的三锌指结构做为基本骨架而构建的,由于转化效率所造成的库容的限制,在一个文库中最多只能把一个锌指单元中的α螺旋的几个关键氨基酸位点完全随机化。因此,每次只能筛选到识别3~4bpDNA的一个锌指单元,然后再把这些锌指单元串联组合成可以识别比较长的DNA片段的多指串联体。
利用噬菌体展示技术筛选具有新的DNA 特异性的锌指的策略最常见的有以下三种:“平行筛选”(Paralle
selection)、“顺序筛选”(Sequential selection )以及“两部分筛选”(Bipartite
selection)。
三种策略都是以Zif268中的三锌指结构(在下文中将其三个锌指单元简称为F1、F2 与F3)
作为骨架,区别在于在文库构建中选取了不同的随机化部位,并在筛选中采用了不同的策略。
7.2.1.2 其他策略
酵母单杂交系统,细菌双杂交系统,以及哺乳动物细胞筛选系统的最大优点,是它们都是在活的细胞中筛选锌指,因此筛选条件更加接近于正常的生理环境(如染色质结构、DNA修饰、其他的细胞或组织特异性因子的存在等),并且特异作用于靶DNA的锌指蛋白经过一轮筛选就可以得到。
7.2.2
识别更长序列的锌指的串联
由于目前通过文库筛选得到的大多是三锌指结构,于是常常需要把多个锌指单元通过接头串联起来。实现这个目的的方法有两种,一是利用在天然的多锌指蛋白中常见的连接肽(linker)或者人工设计的更长的连接区把多个锌指串联起来;二是将两个三锌指结构分别与二聚化区域融合,令其发生二聚化而形成六指结构。常用的二聚化结构域包括Gal4的二聚化结构域,以及亮氨酸拉链。
7.3
人工转录因子的应用
对于内源性基因的表达进行人工干预的方法有很多种,例如反义技术、核酶、基因敲除与敲入,以及近期发展起来的RNA干涉技术等等。其中基因敲除与敲入技术虽然具有相当突出的优点,但步骤烦琐,并且对仪器与操作人员的要求比较高,并非一般实验室都很容易开展;
其他如反义技术等大多是在基因转录以后的mRNA水平上进行调控,需要针对大量的靶标来作用,并且其作用仅限于抑制基因的表达。
人工转录因子则是通过识别DNA上的位点,对于基因的转录进行调控,因此利用少量的人工转录因子往往就能起到很好的调控效果。
思考题
1、转录因子,DNA结合域,转录调控结构域,核定信号(NLS),寡聚化位点,bZIP转录因子,Dof,MyoD,热休克转录因子HSF,人工转录因子
2、转录因子的结构特征和分类。
3、转录因子的作用特征是什么?
4、Dof蛋白的结构与功能。
5、MyoD蛋白的结构与功能。
6、热休克转录因子HSF的结构与功能。
7、谈谈人工转录因子构建的总体思路与策略。
8、除了本章涉及到的转录因子外,还有哪些重要的转录因子?举例说明。(请查阅相关文献)
加载中,请稍候......