转录因子和DNA在活体内的结合是一个被高度调节的过程。通过改进在活体内识别结合位点或在体外识别结合亲和力的技术,3项研究如今改进了我们对于转录因子捆绑被DNA序列或被辅因子相互作用调节的认识。
为了增加转录因子结合位点的分辨率,Rhee和Pugh改进了已有的染色质免疫沉淀法之后的测序(ChIP–seq)技术。ChIP–seq的局限在于一些DNA不会与不感兴趣的受到污染的测序库蛋白质捆绑在一起,导致了很高几率的假阳性。
作为补偿,目前正在使用高严密性的数据筛选,但这又导致了难以识别一些真正的结合位点。Rhee和Pugh于是在蛋白质被DNA交联后引入了一种核酸外切酶步骤;这种做法排除了DNA侧翼的交联位点和DNA污染物。他们把这种方法称为ChIP–exo,并用它来以比ChIP–seq更高的分辨率识别低使用率结合位点。例如,在人类细胞中,他们能够比之前的报道识别出更多的转录调节因子CTCF的结合位点。
序列特异性并非是蛋白质—DNA结合的唯一调节因子;一些拥有未知DNA结合域的辅因子蛋白质能够形成具有转录因子并可调节其活性的复合物。
Slattery等人将配体系统进化指数富集(SELEX)技术——用来确定针对一个DNA序列的蛋白质特异性——和高通量测序耦合在一起,从而确定辅因子如何调节DNA的结合优先性。作者利用这种SELEX–seq方法研究了是否果蝇的辅因子外突(EXD)能够调节所有8种同源(HOX)转录因子的DNA结合特异性。尽管它们具有不同的功能,这些蛋白质在体外都能够结合到高度相关的序列。
作者发现,EXD结合HOX蛋白质调节了这些蛋白质的序列特异性。他们确定了3类结合位点的优先性,在果蝇的发育过程中,HOX蛋白质域的表达沿着轴线的前后共线;因此,这些结合优先性在一定程度上解释了HOX蛋白质的不同功能。
在第三项研究中,Siggers等人将定制的蛋白质结合微阵列(PBM)与表面胞质基因组共振(SPR)试验耦合,以确定没有独自结合DNA的辅因子如何影响转录因子的DNA结合特异性。他们发现,为了结合到一个特别的目标位点集合,酵母转录因子Cbf1需要一个具有Met28辅因子和Met4转录活化蛋白质的复合体。这种蛋白质复合体及其目标位点的相互作用通过来自已知Cbf1结合位点的一个固定距离的一个特定序列模体被提高了。因此,缺乏任何内生DNA结合特异性的辅因子涉及到转录因子复合物对其目标位点的补充。
这3项研究强调了DNA—蛋白质相互作用的微妙之处,并且在这些研究中所表现出的方法论的改进将更进一步帮助剖析这些复合体调节的相互作用。
ETS(E-twenty
six)是转录因子家族中的最大的一个家族之一,它是后生动物所特有的。该家族基因在人中有29个,在老鼠中有28个,在线虫中有10个,在果蝇中有9个。组成此家族的基因被认为是基因通过被白血病病毒(leukemia
virus, E26)转化而来的。该家族的成员与不同组织的发育和癌症相关。
所有的ETS家族蛋白,都有一个高度保守的DNA结合结构域,即ETS结构域,该结构域有一个螺旋转螺旋的侧翼,可以结合有GGA(A/T)序列的DNA结合位点。就如与DNA结合
的功能一样,有事实证明ETS结构域也包括蛋白质与蛋白质之间的相互作用。
叉头框(forkheadbox,Fox)蛋白家族是一类DNA结合区具有翼状螺旋结构的转录因子,目前已有17个亚族。
Sp1,通过3个Cys2His2锌指,与富含GC的位点特异性结合.
在果蝇属胚胎调节因子Krüppel中也存在类似的DNA结合区,随后具有与Sp1高度相似锌指结构的其他转录因子相继发现,形成一个新的Sp1/Krüppel样转录因子(KLFs)家族。
Kruppel样转录因子(Kruppel-like
factors,KLF)是一类具有锌指结构的转录因子,其典型结构特征是在其羧基端具有3个C2H2锌指结构。
它们存在于从线虫属到人类的种属中,参与基因转录复制.
在人类存在21个Sp1/KLFs基因,大鼠中有17个Sp1/KLFs蛋白与人同源,而小鼠则有11个同源.
目前对于人类和其他物种的Sp1/KLFs蛋白的功能和结构尚无系统比较,Sp1/KLFs家族与各种富含GC的DNA元件结合而调节转录、细胞生长和控制生物形态发育,除了KLF2
(LKLF)和KLF1
(EKLF)外,编码Sp1样蛋白的基因是随意分布在整个基因组中,其产物功能独立,这与其他重要的进化调节因子如Hox转录因子、KRAB因子截然不同。
根据序列和结构相似性,将Sp1/KLFs家族分为三个亚家族.
与Sp1高度相关的命名为Sp1-6形成亚家族I,其他的组成另外两个亚家族II和III。
bZIP(basic region/leucine
zipper)类转录因子,包含一个碱性区域和一个亮氨酸拉链区,这种结构普遍存在于各种真核生物之中。比如,在动物中,bZIP作为分子模型用于研究TF-DNA互作、蛋白质三级结构的形成和转录因子翻译后的修饰。整个bZIP结构域是一个ɑ-螺旋,其上有两个重要的结构特征:1、由约16个氨基酸残基组成的碱性区域包含一个核定位信号和一个结合DNA的N-x7-R/K模体;2、亮氨酸和其它大的疏水氨基酸的重复排列结构正好距离C-末端9个残基,两者共同形成一个极性ɑ-螺旋。两个极性ɑ-螺旋通过亲水基团互相作用形成拉链结构(Hurst,1995)。植物bZIP蛋白结合核心序列为ACGT的DNA区域,而且侧翼碱基能影响其结合的特异性,其中A-Box(TACGTA),C-Box(GACGTC),G-Box(CACGTG)更易被特异结合(Izawa等,1993)。
WRKY是植物特有的一类转录因子家族,因含有由WRKYGQK
7个氨基酸组成的保守序列而得名,在拟南芥(Arabidopsis
thaliana)中共发现了74个成员。WRKY蛋白能与TTGAC序列结合。WRKY转录因子专一地结合W-box等DNA序列。
MYB(v-myb avian myeloblastosis viral
oncogene
homolog)类转录因子家族,是指含有MYB结构域的一类转录因子。MYB结构域是一段约51-52个氨基酸的肽段,包含一系列高度保守的氨基酸残基和间隔序列。DNA结合域是由52个氨基酸组成的Helix-helix-turn-helix的结构。
首先是每隔约18个氨基酸规则间隔的色氨酸残基,它们参与空间结构中疏水核心的形成。有时色氨酸残基会被某个芳香族氨基酸或疏水氡基酸所取代,尤其是在植物R2R3-MYB转录因子中,R3MYB结构域的第一色氨酸经常被亮氨酸、异亮氨酸或苯丙氨酸所取代。
其次,在每个保守的色氨酸前后都存在一些高度保守的氨基酸,例如在第一个色氨酸的C-末端通常是一簇酸性氨基酸正是上述这些保守的氨基酸残基使MYB结构域折叠成螺旋-螺旋-转角-螺旋结构。Myb转录因子专一地结合AtMyb域。
根据所含MYB结构域的数目,植物中的MYB类转录因子可简单分成3个亚类:只含以一个MYB结构的MYB蛋白亚类成员可能是一类重要的端粒结合蛋白,在维持染色体结构的完整性和调节基因转录上起重要作用(Bilaud等,1996);R2R3亚类成员含有由两个MYB结构域构成的DNA结合功能域,是植物中数目最多的一类MYB蛋白,它们或参与次生代谢的调节,或控制细胞的分化,或应答激素刺激和外界环境的胁迫以及抵御病原菌的侵害;R1R2R3亚类蛋白,与动物、真菌的R1R2R3-MYB高度同源,主要参与细胞周期的控制和调节细胞的分化(Ito等,2001;Abe等,2003)。
R2R3-MYB类转录因子的DNA结合功能域由两个同源的MYB结构域(R2,R3)组成双部位结构,通过R2和R3MYB结构域的协同作用完成与靶序列的特异结合,是一种比较独特的DNA结合功能域的组织方式。
转录调控因子
c-Myb 是 Myb 转录因子超家旅中的一员,在造血细胞的分化和增殖过程中起重要作用。c-Myb 的 DNA 结合结构域(DNA
binding domain,DBD)由3个不完全重复的结构单元串连组成,分别命名为 R1、R2和 R3,该 DBD
能够特异性的识别包含有 yAACNG 基序的 DNA 序列,其中 R2R3是能够完成特异性 DNA
识别的最小结构单元。核磁共振研究结果表明, c-Myb DBD 中的 R3能够特异性识别 yAACNG 基序中的 AAC 核,而
R2与后半位点中的 G 发生特异性作用。
AP2/EREBP转录因子专一性结合GCC/box。
在拟南芥中,3个最大的转录因子家族是AP2/EREBP,Myb-(R1)R2R3和BHLH家族,每种大约占总转录因子数的9%。
AP2/EREBP域。此域由58或59个氨基酸组成,可以形成一个α-螺旋和一个3条带的反平行β-折叠的组分,后者可以与DNA螺旋中的碱基对相互作用。家族成员特异性的结合于核心序列为GCCGCC的GCC-box顺式作用元件上。但是,DREB蛋白特异性的结合于含PuCCGAC为核心序列的DRE/C-repeat顺式作用元件上。
DRE/C-repeat序列很像GCC-box,两者都是以CCGNC为共同的核心序列。
加载中,请稍候......