蛋白质结晶
(2012-01-18 22:23:24)
标签:
蛋白质x射线沉淀剂晶体学文化 |
分类: 分子生物学专业 |
(2).蛋白质结晶;
(3).收集衍射数据;
(4).确定相位;
(5).相位的改进(优化);
(6).电子密度图的解释;
(7).结构修正;
(8).由结构确定蛋白功能。
蛋白质结晶(Crystallizing a Protein)
1.1 引言(Introduction)
当别人在谈论傅立叶和帕特森,或者分子置换及分子动力学改良时,新到蛋白质X射线晶体学实验室的同学们可能会迷惑。然而,他们立即会明白要想确定蛋白质的结构,首先必须生长出合适的晶体。没有晶体,便谈不上用X射线确定蛋白质结构。这一章,我们讨论蛋白质晶体生长的原理。作为实践,我们将给出结晶溶菌酶的方法。我们还将得到一个溶菌酶晶体的X射线衍射图像,这将提供对X射线衍射的简介。这一章包括一个关于常见问题的讨论。
1.2 蛋白质结晶原理(Principles of Protein Crystallization)
蛋白质的X射线结构分析首先要获得合适的单晶。蛋白质结晶学尚未发展成熟,尽管很受人亲睐,特别是受航天飞机中微重力实验 (Kundrot et al., 2001; McPherson et al., 1995) 的激发。蛋白质结晶是一个反复试验的过程,蛋白质逐渐会从溶液中析出,杂质、晶核及其他未知因素对此过程有所影响。通常,蛋白质越纯,生长晶体几率越大。蛋白质结晶学者对蛋白质的纯度要求要严于生化学家的要求,后者往往在酶催化活性足够高时就很满意。另一方面,为了使蛋白质结晶,不仅要加其他成分,所有蛋白质分子的表面性质也必须是相同的,特别是表面的电荷分布,因为它影响晶体内分子的聚集。质谱是蛋白质结晶中的一种有效工具,例如检测重组蛋白的表达、样品纯度、重原子衍生物及蛋白质结构的特性(Cohen, 1996; Potier et al.,2000)。
蛋白质结晶涉及四个重要步骤如下:
1.
2.
3.
4.
蛋白质结晶 |
理论告诉我们,最好的晶体生长要减少过饱和度到一个低的水平;维持高饱和度可能导致过多晶核的形成,从而产生很多小晶体(如图1.1)。同时,晶体需要缓慢地生长以在表面达到一个最高的有序度。然而实际中,并没有遵从这个基本规则。最简单的改变过饱和度的方式是改变温度或沉淀剂的浓度。 蛋白质沉淀可以通过添加盐、聚乙二醇或有机溶剂。作为沉淀剂,盐有双重作用,即盐析和盐溶。盐离子屏蔽了蛋白质分子表面的电荷,因此从而减弱了分子间的排斥力。此外,部分水被固定从而不可与蛋白质结合,因为盐离子周围形成水化层。最常用的盐是硫酸铵,其优点是溶解性好,对大多数蛋白质无损害,即使浓度很高。 聚乙二醇对水有高亲和性,能像盐那样固定水。而且,它以不同的方式影响蛋白质的溶解度。PEG分子不能超过其半径而更接近蛋白质分子表面,蛋白质分子周围有PEG中心不能接近的水化层。如果蛋白质分子聚集,这些水化层部分重叠,从而不可接近的区域变小。结果,可接近区域变大。从而有更多的空间对PEG分子可用,它们的熵增加(以一些蛋白质熵为代价),系统的自由能降低。因此,蛋白质分子聚集的这种情况在使用PEG时是最有利的。 蛋白质结晶中最普遍的有机溶剂是MPD。有机溶剂具有静电效应,它们能降低介质的的介电常数。静电力变强,从而压缩蛋白质分子周围离子的双电层。这些分子可以彼此更加接近,如果在一个有利的方向,它们便可以聚集。 一些蛋白质在水中溶解度不好,但是如果加入少量盐(比盐析少的多)就可溶解。移除盐后,蛋白质便会析出。这种盐溶效应可以解释为蛋白质分子表面带电基团和溶液中离子相互竞争的结果。在有溶剂离子时,蛋白质分子不会被离子双层包围,而能通过不同蛋白质分子上异种电荷之间的库仑力相互聚集。如果少量离子被加入,蛋白质周围会形成离子双层,它们彼此之间不扩散不排斥。 其他降低蛋白质溶解度的方法有改变溶液pH或温度。 综上所述,通常结晶蛋白质的步骤如下: 1. 2. b. 改变pH或温度。 实际中,通常可用作结晶实验的蛋白质的量非常少。要确定最好的结晶条件,经常需要进行大量的实验。因此,每次实验应该用最少量的蛋白质。一个合理大小(0.2×0.2×0.2mm = 0.008mm3)的蛋白质晶体重约10μg。因此,1mg纯化的蛋白质可以足够做大约100次结晶实验。 膜蛋白在水中不溶解,因此很难结晶。通常的策略是使用洗涤剂将其溶解于水溶液中,然后采用水溶性蛋白的操作程序(Michel,1990; Sowadski, 1994)。Landau和Rosenbusch(1996)引进一种新的方法能够结晶膜蛋白。他们采用脂立方相作为各种化合物结晶的母体,脂立方相是具有立体对称性的液晶,它们能在脂和水的混合物中形成(Lindblom and Rilfors, 1989)。一些类型的脂立方相是存在的。Landau等人(1997)成功地在某一类型脂立方相中生长出了高度有序的细菌视紫红质(bacteriorhodopsin)膜蛋白晶体(see also Gouaux, 1998)。但仍要看是否这种方法在结晶更多膜蛋白中取得成功。 |
蛋白质结晶方法大总结 |
1.结晶方法(Crystallization
Techniques)
1.1 分批结晶(Batch Crystallization)
这是最老的最简单的结晶方法,其原理是同步地在蛋白质溶液中加入沉淀剂,立即使溶液达到一个高过饱和状态。幸运的话,不需进一步处理即可在过饱和溶液中逐渐长出晶体。一个用于微分批结晶的自动化系统已被Chayen等人设计出(1991,1992),其微分批方法中,他们在1-2μl包含蛋白质和沉淀剂的液滴中生长晶体。液滴被悬浮在油(如石蜡)中,油的作用是作为封层以防止蒸发,它并不干扰普通沉淀剂,但是干扰能溶解油的有机溶剂(Chayen,
1997; see also Chayen, 1998)。
1.2 液-液扩散(Liquid–Liquid Diffusion)
这种方法中,蛋白质溶液和含有沉淀剂的溶液是彼此分层在一个有小孔的毛细管中,一个测熔点用的毛细管一般即可(如图1.2)。下层是密度大的溶液,例如浓硫酸铵或PEG溶液。如果有机溶剂如MPD被用作沉淀剂,它会在上层。以1:1混合,沉淀剂的浓度应该是所期最终浓度的二倍。两种溶液(各自约5μl)通过注射器针头导入毛细管,先导入下层的。通过一个简易的摇摆式离心机去除气泡。再加入上层,进而两层之间形成一个明显的界面,它们会逐渐彼此扩散。
Garc??a-Ruiz and
Moreno(1994)已经发展液-液扩散技术至针刺法。蛋白质溶液通过毛细力被吸入狭窄的管中,管的一端是封闭的。接着,开放端被插入置于小容器的凝胶中,凝胶使得管竖直,蛋白质溶液与凝胶接触。含有沉淀剂的溶液被倒在凝胶上,整个装置被保存于封闭的盒子以防蒸发。沉淀剂通过凝胶和毛细管的扩散时间可以由毛细管插入凝胶的深度控制,从而蛋白质溶液中即可形成过饱和区域,毛细管底部高而顶部低。这也可作为一个筛选最佳结晶条件的额外信息。
1.3 蒸气扩散(Vapor Diffusion)
1.3.1 悬滴法(The Hanging Drop
Method)这种方法中,在一个硅化的显微镜盖玻片上通过混合3-10μl蛋白质溶液和等量的沉淀剂溶液来制备液滴。盖玻片置于一个盘子的凹槽之上,凹槽的一部分填有所需的沉淀剂溶液约1ml。在盖玻片放好之前,小室的凹槽周围用油或油脂密封(如图3)。
1.3.2 沉滴法(The Sitting Drop
Method)在悬滴法中,如果蛋白质溶液表面张力很小就会在盖玻片表面展开。此时,沉滴法更有利,图4给出了沉滴法的简图。
1.4
透析法(Dialysis)除了上述使得蛋白质结晶的方法,还有许多透析技术。透析的优点是沉淀溶液容易改变,对于适量的蛋白质溶液(多于0.1ml),可用透析管完成(如图1.5a)。透析膜通过橡皮圈连在管子上,但在使用前要用水大量漂洗或最好在水中煮约10min。对微升量的蛋白质溶液而言,可以使用覆有透析膜的厚壁微毛细管(Zeppezauer
method)或者树脂玻璃纽扣(如图1.5b)。纽扣的缺点是纽扣中的蛋白质晶体不能通过极化显微镜观察到。
另一种微透析方法在图1.6中有描述,将5μl蛋白质溶液注射到一个毛细管中,毛细管覆有透析膜,膜可用塑料管套紧。对蛋白质溶液进行简单离心,然后用铸模粘土将毛细管封闭,接着将毛细管放入含有透析液的Eppendorf管中。
|
获得蛋白质的晶体结构的第一个瓶颈,就是制备大量纯化的蛋白质(>10 mg),其浓度通常在10 mg/ml
以上,并以此为基础进行结晶条件的筛选。运用重组基因的技术,将特定基因以选殖(clone)的方式嵌入表现载体(expr
在取得高纯度的蛋白质溶液后,接下来就是晶体的培养。蛋白质晶体与其他化合物晶体的形成类似,是在饱和溶液中慢慢产生的,每一种蛋白质养晶的条件皆有所差异,影响晶体形成的变量很多,包含化学上的变量,如酸碱度、沈淀剂种类、离子浓度、蛋白质浓度等;物理上的变数,如溶液达成过饱和状态的速率、温度等;及生化上的变数,如蛋白质所需的金属离子或抑制剂、蛋白质的聚合状态、等电点等,皆是养晶时的测试条件。截至目前为止,并无一套理论可以预测结晶的条件,所以必须不断测试各种养晶溶液的组合后,才可能得到一颗完美的单一晶体。
蛋白质晶体的培养,通常是利用气相扩散法(Vapor Diffusion Method) 的原理来达成;也就是将含有高浓度的蛋白质(10-50 mg/ml)溶液加入适当的溶剂,慢慢降低蛋白质的溶解度,使其接近自发性的沈淀状态时,蛋白质分子将在整齐的堆栈下形成晶体。举例来说,我们将蛋白质溶于低浓度(~1.0 M) 的硫酸铵溶液中,将它放置于一密闭含有高浓度(~2.0 M)硫酸铵溶液的容器中,由气相平衡,可以缓慢提高蛋白质溶液中硫酸铵的浓度,进而达成结晶的目的。
蛋白质晶体在外观上与其他晶体并无明显不同之处,但在晶体的内部,却有很大的差异。一般而言,蛋白质晶体除了蛋白质分子外,其他的空间则充满约40 %至60 %之间的水溶液,其液态的成分不仅使晶体易碎,也容易使蛋白质分子在晶格排列上有不规则的情形出现,造成晶体处理时的困难及绕射数据上的搜集不易等缺点。但也由于高含水量的特性,让蛋白质分子在晶体内与水溶液中的状态,极为相似。所以由晶体所解出的蛋白质结构,基本上可视为自然状态下的结构。
1前言………………………………………………………………………………………………1
1.
2蛋白质结构测定的基本步骤
3结晶
蛋白质结晶技术的综述请参看参考书5-7。通常只需要毫克级的均一的蛋白纯品(
通常纯度至少超过95%)便可进行蛋白质结晶研究。最初的条件实验一般需要1-2mg,但最终得到解析出蛋白质结构所需的数据,可能需要几毫克或更多的蛋白质样品。在摸索晶体生长条件时应考虑分子生物学家或蛋白质化学家所提示的溶液中影响蛋白质稳定性及构象的各种因素;尽量避免蛋白质样品的反复冻融,已经证明许多蛋白冷冻干燥处理后对结晶不利;使用5-50mg/ml甚至更高浓度的蛋白质溶液,一般来说,
浓度越高, 效果越好, 至少起始时是如此。不过也有浓度为2mg/ml蛋白质结晶的先例;过滤蛋白质溶液, 缓冲液等,
清洁任何玻璃或塑料表面上的尘粒(光学商店清洁镜头的除尘器效果很好), 以最大限度地减少成核中心的数量。
悬滴法长晶体包括以下四个步骤:
第一步, 在作结晶实验之前,最好对蛋白质样品进行离心, 以除去不溶解的蛋白和杂质,
以减少不必要的成核中心, 此外,对蛋白质样品进行超滤,也是值得推荐的。
第二步, 采用“吹气法”除去培养晶体用的组织培养板和盖玻片上可能带有的灰尘。
第三步,在组织培养板的孔中加入0.2 - 0.5ml经过超滤的含沉淀剂及添加剂的缓冲液,作
为池液, 孔边缘涂上真空脂。
第四步, 吸1ul或2ul池液放到硅化后的盖玻片上, 加等体积蛋白溶液至此池液上 (这个体
积比将决定平衡后的蛋白质浓度),混合均匀, 应避免气泡出现。
第五步, 翻转盖玻片盖在孔上, 检查密封是否良好。
除汽相扩散技术外,微量透析法(Dialysis buttons from Cambridge Repetition
Engineers)和微量批处理法(Douglas Instruments Ltd) 也是值得了解的。由于多种因素的影响,
蛋白质结晶仍是一门艺术。 表1列出了一些目前经常用到的进行蛋白质结晶的基本条件和思路。硫酸胺,
二甲基-2,4-戊烷二醇(MPD)及PEG 4000是初次结晶时经常使用的沉淀剂,
在参考书7中列出了用这些沉淀剂进行的一些研究项目,表1中列出的很多方案在参考书5-7
中都有介绍。应用不完全因子法筛选实验条件的子集合方法目前在几个实验室经常使用(Hampton
Research)(10)。动态光散射法目前已被发展用于监测潜在的结晶条件,可以作为摸索结晶条件的辅助工具(11)。当单独的蛋白质不能结晶时,
往往能与其抗体(Fab片断)以及其他生物大分子共结晶(12)。非离子去垢剂可辅助几个完整膜蛋白的结晶而大大拓宽了晶体学的研究领域(13,14)。糖基化位点较多的蛋白也需要特殊考虑,一个方法是使用神经氨酸酶的处理方法以降低糖基化水平。最近有建议使用甘油作为辅助溶剂以帮助柔性较大的蛋白结晶(15)。然而分子内的高柔性常常迫使人们使用截去蛋白的N端或C端(柔性过大的部分)以后再进行结晶。
在初次出现晶体时,往往需要回答以下两个问题:
1.
2.
表1: 结晶实验中的常用条件和思路
沉淀剂
盐: 硫酸胺, 甲酸胺, 柠檬酸钠
PEG: 400, 4000,3000,
有机溶剂: MPD, 乙醇 (4?C, 很难避免其蒸发)
混合物: PEG+0.5-1M LiCl或NaCl, 盐+2-4%有机溶剂
添加剂
0.25%-1% 非离子去垢剂 如β- 正辛基?-D-吡喃型葡糖(苷)甙 (β-octyl glucoside)
二氧六环 (Dioxane)
金属离子 如Ca2+, Zn2+
还原剂:
甘油
可变条件
pH
缓冲液类型
温度: 通常尝试5?C和20?C
结晶环境: 重力或微重力 (太空中结晶, 很费钱!)
共晶生长试剂
抑制剂
辅因子
底物
单克隆抗体片断(Fabs)
蛋白样品的变化
采用限制性蛋白酶酶解
采用基因工程方法修饰N端或C端(如截短)
采用不同种类的蛋白或突变体蛋白
采用不同表达系统 (如“对付”糖基化等)
方法2:相对于时间进程的晶体密度测定方法步骤如下
1.
2.
3.
4.
5.
Mp =2.324(v/n) {?c-1}
4数据收集
采用同步辐射加速器光源收集数据,体积为0.1x0.1x0.1mm3或更小一些的有序晶体已足够。
在一般实验室里用旋转阳极作为X光光源收集数据,则需要较大的晶体。 蛋白质晶体通常装在适当内径的玻璃或石英毛细管中
(Astrophysics Research Ltd.), 见图2a。
参考书20中给出了详细的晶体操作注意事项。易碎的平板样晶体可装在特制的扁平毛细管中(20)。如计划在数据收集过程中浸入底物则可将晶体装在一个流动的小盒中(20)。室温下,晶体在X射线照射下会受到损伤,影响它的寿命。在低温条件下收集数据,将会延长晶体寿命,提高数据的质量。高盐环境中生长的晶体,通常冷冻至–10oC不会有不良影响。在低温条件下收集数据,可用Cryo装置。通过表面张力将晶体悬置在一个薄金属圈限定的液滴中(22),
然后,将晶体快速冷冻至液氮温度(通常在100K左右), 这样可大大延长晶体寿命(23),
见图2b。但使用者必须预先评估特定的晶体在实现这个过程中经常遇到的困难与使用此法的益处。
只有为每一个新蛋白质晶体建立一个最佳的条件(主要是选择合适的冷冻保护剂)才能真正地受惠于低温数据收集。一些对温度变化特别敏感的晶体,必须严格在其生长温度的环境中安装。
图2a
图2b
进行酶作用机理研究的时间分辨结构测定工作要求数据收集的速度能够跟得上反应速度。
这时可用极高光通量和准直度的同步辐射加速器作为X-光光源,并用Laue法(白光)收集数据,以满足其速度上的要求。 总而言之,
数据收集是一个较为专业化的领域, 在这里就不再论述了。
表2列出了与数据收集有关的资料,如X-光光源,
探测器及数据收集方法等。封闭管是最弱的X射线源,目前大多数实验室使用旋转阳极或同步辐射加速器作为X-光光源。
同步辐射加速器的优点是:
1.
2.
3.
与铜靶相比, 旋转金靶阳极具有X射线波长短的优点, 金靶的特征发射光谱包括了PtLIII的吸收边缘,
因而,一般实验室中的旋转阳极,MAD法可有一些应用 (参见参考书26)。 随着工作波长在1A以下的探测器的使用,
应重新评价不同阳极材料的不同优点。
单位晶胞很大(晶胞大于200A)的晶体的在一般实验室中的旋转阳极上的数据收集通常要求配备聚焦能力较强的Frank型棱镜系统。对于要求相对较低的一般实验室中的旋转阳极上数据收集,
我们现常用易于匹配且更富于变化的光学系统, 例如石墨单色器和平行光管。 同样,随着新的探测器的应用,
我们应重新认真评价X光光学系统及在同步辐射加速器上应用的技术在一般实验室中的X-光系统上的推广和应用。
表2 X射线源 密封管 旋转阳极 同步辐射加速器 X射线棱镜(一般实验室中) 镍过滤器 石墨单色器 Frank反射镜 光纤系统 X射线探测器 线性比例计数器 摄影胶片 外部带磷光体的电视区域监测器: FAST 多丝正比计数器: Hamlin/Xuong, Xentronics Imaging plates 图像盘 CCD 数据收集方法 衍射仪法 徊摆法 Laue法(白光辐射) 目前探测器主要有摄影胶片、电子面探测器、图像盘(Imaging Plate)以及CCD。 目前较为广泛采用的是图像盘或CCD, 这两种检测方式可在较宽的X射线波长范围内提供较 高的灵敏度及低背景, 适于衍射较弱的晶体。 必须指出,在一般实验室采用大面积、高分辨率探测器,需要新一代X-光光学系统去匹配 才能有效益。 用回摆法收集数据是目前最常用的方法。下面就有关参数的选择提供一些参考意见: 1, 2, 3, 4, 5, 在常规的光束下使用回摆法时,位于旋转轴的附近数据一般来说是无法测量的。但如果使用较短的波长,可以减小旋转轴附近的不可测区域;另外将晶体的对称轴校准在离旋转轴几度的地方,即使晶轴略微偏离旋转轴,则倒易格子中的对称性经常允许记录与旋转轴附近对称性相关的数据,这也可减少盲 区。 蛋白质可能的空间群见表3, 晶体形态学常常给出晶体学轴的对称性和取向的线索, 经典的空间群的初次鉴定通常在旋进相机上进行,但根据我们的经验, 在晶体轴的00, 900以及适当的话300或450回摆照相经常足以确定晶胞的大小及晶体学点群(表3)。由原始数据的系统消光规律可以定义晶体的螺旋轴。我们认为首先是收集数据, 不要将非常珍贵的晶体浪费在了解晶胞的特点上, 可在一个较低的对称空间群上处理数据,并检查可能的对称等效点。除非有相位信息,许多对映体结构不能被区分, 如P3121和P3221。 但这并不影响数据收集和处理。 数据处理一般包括以下几个步骤: 第一步指标化,以确定晶胞参数和格子类型。 这一步现在经常采用自动指标化算法(29),以保证在X光束下晶体寿命不会浪费在晶体的定向上; 第二步预测全部衍射点的记录位置; 第三步整合 (现经常使用‘profile fitting’(30)): 包括预定点位置的强度测量及适当背景值的估算; 第四步对称等效点的比例因子的校正和平均、归并以给出一套独立数据,在此过程中,还需要校正随时间变化的晶体损伤及晶体外形不规则所造成的吸收效应的差别。 上述方案中,适当时候,也需要进行对探测器及光源依赖的校正。 有的时候,需要进行特殊的吸收效应校正(31)。后修正(post-refinement)对于不完整衍射点(partiality)强度偏差的估计有改善作用, 尤其是在病毒晶体学中尤为适用(32)。强度数据最终统一后(scaling),一般情况下,所得到的强度的R因子的变化应在3%(良好的数据)和11%(很弱的数据)之间。 衍射强度的R因子定义为: 对于某些空间群 (见表3) 倒易格子的几何对称性比其强度的对称性高 (这样对指标的选择可能存在歧义), 数据收集过程中的晶体在毛细管中的滑动可能导致对该部分数据分开处理。一套完整的原始数据,它的完整度(completeness)应超过80%,而且缺失数据在倒易空间中应随机分布;全部数据至少高于独立数据(即它的丰度redundancy)2-3倍以上,以便得到正确的比例因子,提高数据的精度。 数据的质量对结构分析中以后各阶段的重要性是不言而喻的,不过,如果因为数据的收集量大(redundancy高)而使得数据的Rmerge增加了一点并不是坏事,因为统计测量的信息量的真相将表现在最终的电子密度图中,在这种情况下最终的准确性将会提高。 Rmerge作为分辨率函数的指标必须进行监测, 很多人认为一个分析的最高分辨率的壳层的Rmerge不应超过25%,数据的完整性对初始相位及结构测定是很重要的, 而对于以后的差值电子密度图就不太重要了。 对于非晶体学对称性, 差值电子密度图所需的数据部分可进行粗略估计, 如对于五重对称, 一个(随机样品)的完整数据的1/5应就足够了。 5. 在晶体中一个不对称单元中有多个相同的蛋白质分子时, 一些有价值的分子之间堆积的信息可直接从结构振幅计算得出,而不必要预先知道任何相位信息: 1. 2. 5.1 单对或多对同晶置换法(SIR/MIR) 这是目前最常使用的方法, 该方法的基础是以测量重原子 (常为金属) 结合到蛋白质分子上有限的几个特异位点时而导致的衍射强度差(变化)。常用的试剂列在表4中,详细的使用在参考书34中有讨论。由于这些试剂毒性都很大,处理时一定要严格按规定的方法进行。制备重原子衍生物晶体,一般采用将母体晶体浸在重原子溶液中,重原子化合物的常用浓度范围为1mM-10mM,浸泡时间可从数小时到数天,浸泡条件的摸索尽量用小晶体作试验,记住大晶体必须用于数据收集。浸泡过程中要注意观察,首先必须保证浸泡于重原子溶液中的晶体不出现裂痕。重原子衍生物晶体也可尝试用共晶生长法(Co-crystallization)来制备。 表4:常用的重金属化合物: phosphate(EMP),mercuric acetate,mersalyl,1,4-diacetoxy mercuri-2,3-dimethoxybutane (Baker’s dimercurial) Complex ions and clusters: K2HgI4 in excess KI, tetrakis(acetoxymercuril) methane(TAMM),(H2O)3](CF3SO3)2(WAC) 蛋白质分子中某些化学基团在传统上是重原子衍生物制备的首选对象, 如游离的巯基, 在参考书34中有讨论。单一暴露的二硫键可被还原并掺入一个汞原子(35)。 人们也试图用重原子簇来制备重原子衍生物,重原子簇具有较大的质量和特征的对称性,可与晶体的特定性质相匹配(36,37)。进行蛋白突变以提供理论上适于重原子结合的位点(如定点突变产生游离半胱氨酸,谷氨酸)(38)。然而有用的重原子衍生物的获得仍有赖于运气的好坏,晶体颜色或密度的改变可对重原子是否结合提供一些提示,但最终仍要依赖于X射线的数据收集。将母体和衍生物晶体的数据相比较: 1. 2. 图3: 每个重原子衍生物可收集一小部分衍射数据(较低分辨率)来判断其是否有用。 然后对那些有希望的样品进行全套数据收集(高分辨率)。对不同晶体的同一种重原子衍生物数据一起合并要十分小心, 因为重原子的占有率可能不同, 需要对每一套数据分别进行重原子修正(39)。 所以,最好能从一个晶体中收集一套完整的重原子数据。在统一重原子衍生物与母体数据(Scaling)时也应注意各向异性的比例因子的影响(39)。重原子的反常散射信息在消除位相的双解上是很重要的,即使反常散射信号往往比同晶差值小一个数量级(见5.3及图3)。 成功的反常散射信号的取得主要决定于数据收集和统一时的精度。 相关系数是评价反常散射差值可靠性的一种简单的指标(39)。 对于低对称性空间群的晶体,如果不对称单位内仅有一个或二个重原子位点, 差值Patterson图的Harker截面上几个强峰能立即确定为重原子峰 重原子峰不太明显的情况时,计算各独立分辨率范围的差值Patterson图,通过图间的比较可能有助于典型峰的确认。 从我们的经验来看, 在两个类似图谱间基于2A以上的峰,计算简单相关函数可作为其有用信息含量的一个指标。对于特别复杂的例子,自动Patterson搜索程序非常有效(如参考书40)。由于差值Patterson图是用数据对的差值的平方来计算, 少数大的差值可造成灾难性的后果, 因此去除数据中差值过大的部分(差异大于平均差异的三倍)是很重要的。我们也建议将原点去除作为一种标准操作程序。由于傅立叶级数系数的“断尾效应”,在原点峰周围会造成波动,这可能掩盖图中的真正 峰。 锐化(sharpening)结构因子振幅的观测值可能有助于解释难度较大的图。具有高对称性和(或)高非晶体学对称性的差值Patterson图比较复杂,但这一定要与不能提供正确相位的低质量衍生物的直接噪音相区别。打印出预测的Patterson峰去和实际的Patterson峰进行对比,往往可以帮助解释复杂的差值Patterson图。 重原子位点的坐标可被改进, 并可通过重原子修正程序获得占有率及温度因子的数值。重原子的修正用结构因子或结构振幅。相位修正使用所有可能的信息, 应成为首选方法。 然而, 对于单一衍生物而言, 振幅的修正更为有效,根据我们的经验,对应Patterson图的简单修正效果很好。如果能得到多个衍生物或反常散射数据, 相位的修正会更好一些.。 由于相角的限制, 中心对称反射在这个阶段特别有价值。遗憾的是重原子修正会增加由于偏差而导致的问题,尤其是对于非中心对称的衍射点。所以用‘眼睛’检查修正是否确实合理改善了差值Patterson图的一致性是很重要的。衍生物的一个主要位点确定后, 得出的相位结果可用于差值傅立叶分析寻找同一衍生物其余次要位点或解决其它衍生物的重原子位置 (同样的,也可检查解出的重原子位置在自身Patterson图中是否有所表现)。 下列各步可提供进一步的检查: ? ? ? 一般情况,好的重原子衍生物的蛋白质相位的最终平均品质因子值应为0.6或更好,平均品质因子值降至0.3,则意味着相位信息需合理权衡才能与其它衍生物的相位合并使用,或可用第六部分介绍的方法改善。按分辨率壳层监测重原子衍生物的相位力(phasing power)(即重原子结构因子振幅/平均闭合误差(mean error of closure)), 一旦这个数值小于1, 通常认为这个重原子衍生物不再有相位力(也有例外)。总的相位力大于1.5时意味着是一个有潜在使用价值的重原子衍生物。 用单对同晶法解决相位时,相位的双解问题,可用反常散射分量(见5.3部分)和溶剂扁平化(solvent flattening)来解决。在没有反常散射时, Friedel点对(hkl和-h-k-l)强度相同, 因此, 甚至在多个同晶重原子衍生物存在时,仍可能有两种明显(“手”型)为同样有效自身一致的重原子位点(x, y, z或-x, -y, -z)。利用反常散射信息可正确地选择“手”型。 如手型错误的话,A螺旋电子密度图看起来将像左手螺旋; 交换“手”型即可改正过来(注: 对于对映空间群也涉及与“镜像”空间群的交换)。 5.2 分子置换法(MR) 分子置换法是使用一个已知的三维结构作为一个粗略模型,计算被观察的未知蛋白质结构的结构因子振幅的起始相角。当然, 这要假定二者结构上很相似。 因此只有当蛋白质与一个已知三维结构的蛋白质的氨基酸序列同源性很高(通常至少为30%同源性, 50%以上更好)时才能使用这个方法。 一个例外是病毒家族如微小RNA病毒, 尽管序列很不相同, 其中的衣壳结构却很相似。如果大分子复合物其中一个已知组分包括了复合物相当的一部分(超过33%), 则该组分可能就足够了(BTV结构为例)。 如能为同源结构家族建立一个“平均”结构作为起始模型可能更为有利。已知的结构模型必须正确放置在未知结构的晶胞中。如果两个结构相似的话, 它们的Patterson函数也应相似。 对于一个蛋白质晶体的Patterson函数是计算晶胞中分子内向量在原点周围的分布。因此在原点周围的Patterson函数分析可决定模型的取向(采用旋转函数)。 考虑分子间向量后可决定分子在晶胞中的位置(采用平移函数)。使用分子置换法一般分以下三个步骤: 第一步计算交叉旋转函数指出分子的正确取向。 在不同分辨率范围内重复进行计算以检查峰的重复性。计算中试用几个不同的积分半径,但积分半径不应超过未知分子预期尺寸的一半, 尤其是必须小于晶胞最短的尺寸,以避免侵入邻近的原点峰。 P1模型晶胞的尺寸应远远大于模型分子 (以避免分子间向量对Patterson函数的干扰) 。观测结构因子的锐化(sharpening)可能对峰的解释有好处。 第二步将模型以“正确”取向放置在真实的晶胞中,(请特别注意原子坐标的正交化的变化情况!)重新运行交叉旋转函数 (相对旋转现在应为零) 进行检查。 由于第三步对取向的准确性非常敏感, 应注意获取可能的最优数值, 如果几个数值看起来都同等有效,每一个都要尝试第三步。最近设计了一种相关系数修正 (基于将观测值和计算值的Patterson系数之间的一致性最大化) 的简单方法,可以用于修正大量最好的交叉旋转函数的解。这一方法的出现提供了一种自动、可靠的方法去筛选和改进大量的交叉旋转函数的解。 第三步计算平移函数以寻找模型分子在晶胞中的正确位置。, 可根据R因子和相关系数的标准来判断。一般相关系数比R因子具有更高的灵敏度及可靠性。 在实际应用中,不对称单元中存在多个未知分子使计算分析的难度增大, 除非这些分子之间的相对位置已知。在研究模型中加入分子间的相对位置信息对于结构解析会有所帮助 (如对于二体, 三体或四体,尝试低聚物模型)。该方法的应用成功与否可能主要取决于所用的模型,一般情况下,成功的MR方法的范例,其模型分子和未知分子之间的r.m.s.的偏差不大于1?。其他值得注意的有: 1, 2, 3, 判断分子置换法的结果是否正确的标准如下: 1, 2, 3, 4, 然后对此模型进行刚体修正, 开始是在低分辨率下, 起始R因子应在59%以下(随机), 通常为50%,在修正过程中,这值应显著下降,修正可延伸至二级结构单元, 最后按第八部分介绍的进行全面修正。 警告: 由于是以具有较大误差的起始模型的相位为基础,此时的修正很可能具有人为的倾向性, 所以在此阶段的修正及检查电子密度图的过程中必须十分小心(见第七和第八部分)。 5.3 反常散射及多波长反常散射(MAD) 重原子衍生物的反常散射通常作为单对同晶置法相位双解的一种补充信息。 需要强调的是这种效应很弱, 即使是经典的反常散射数据使用也需要准确的测量。 重原子修正过程中的反常散射数据统计应能够区分两个可能的重原子“手”性位点, 如不能实现这一点,则意味着反常散射数据的准确度还不足以为相位确定提供有用的信息。 使用反常散射直接确定相位信息还不标准化, 需要仔细的实验设计, 所以这部分只包括一些浅显的纲要, 有兴趣的读者一定要参看主要参考书。 对于含金属原子的小蛋白分子,金属原子对整体结构振幅的贡献又占了相当比例(至少30%),金属原子的反常散射也能准确测定则可尝试通过部分结构加反常散射的方法确定相位。 对于大的蛋白分子, MAD法要求蛋白质分子中有一个金属原子和波长可调的同步辐射加速器X射线源,结果基本等同于完美的同晶置换法。由于此法依赖于衍射振幅非常小的数值变化,因此必须进行非常准确的测量,在数据收集时必须特别小心。同时或尽量同时(避免晶体损伤造成的误差)在同一张图像上收集Bijvoet点对;收集Bijvoet点对时为相同的光束路径照射晶体(避免不同吸收效果造成的误差);良好的统计计数(目前常用图像盘作为探测器,因为胶片模糊而电子探测器不稳定);用吸收边附近的波长收集数据,具有较强的反常散射效应。数据统一时必须特别小心, 局部的比例因子很重要, 出现反常差值异常差异过大或过弱的数据必须从Patterson函数中去除。 此法在金属蛋白中广泛使用, 对无金属的蛋白进行标记的一个途径是培养细菌以产生含硒代甲硫氨酸的蛋白质, 然而,这要求含硒代甲硫氨酸的蛋白质在细菌中能够表达。当然,也可将重原子衍生物作为母体处理。目前采用含硒代甲硫氨酸的蛋白质晶体,或采用汞或铂家族的化合物作为衍生物的晶体进行MAD方法测定结构已经成为蛋白质晶体学最为常规的发法之一。 6. 在此阶段我们可以考虑利用晶体的不对称单元中蛋白质的多个拷贝(非晶体学对称)或更经常由于晶体的溶剂含量(30-90%不等)所提供的信息。 王必成教授的溶剂扁平化方法(Wang’s solvent flattening)是目前改善相位的一个常规技术, 甚至对于溶剂含量一般(50%)的晶体,在溶剂区域的密度的限制提供了大量的额外的信息(51),而这些信息往往可以消除单对同晶置换法的相位双解,也可改善多对同晶置换法(MIR)的相位,产生一个可解释的电子密度图。原则上任何相位都可用此法进行改善, 因此,近来的结构测定(52)常用此法大大地了改善分子置换法(MR)的相位 (从蛋白质复合物的一个组分的MR相位,计算初始电子密度图; 溶剂扁平化还应用于相应的差值图,可使90%的单位晶胞扁平化, 从而大大增加了未知蛋白组分的电子密度)。 使用溶剂扁平化方法时,以下经验可供参考: 1, 2, 3, 4, 5, 6, 7, 8, 为进行实空间平均, 需要建立: 1, 2, 相位扩展必须在倒易空间逐步进行,以我们的经验, 约为倒易格子单位三分之一的一系列连续步骤就可从G函数计算出适当的数值(42)。 从8 ?到4 ?的分辨率壳层一般含有可确定二级结构位置的信息, 也是倒易空间一个难以正确确定相位的区域。 必须严格注意R因子(收敛后典型的平均R因子值在12-20%之间)及相关系数, 最后检查电子密度图以监测进程。 7. 用平均品质因子大于或等于0.6计算得出的电子密度图的质量较好,一般可以看到: 1, 2, 3, 4, 5, 已知氨基酸序列时,可在3?的分辨率下(在3.5A时,要特别好的电子密度图)将蛋白质结构的电子密度图转为结构模型。早期用堆积画在薄塑料片上的电子密度图以建立初始的肽链走向,但目前用于电子密度图解释的主要工具是计算机图象工作站,由于新的方法的发展,过去流行的“mini map”也趋于消失。 程序的应用可以自动获得电子密度图并可获得分子的框架, 然后与初始密度相联系, 在图象工作站上人工进行连接或改进,从而产生一个粗结构模型, 在此基础上进行详细的电子密度图解释或模型构建。 从数据库中输入已知的蛋白质结构信息对迅速建立一个立体化学上的可信模型提供了进一步的强有力帮助,在电子密度图解释的初始阶段, 一定要建立氨基酸序列与电子密度区域间的对应关系。 因此将数据库中与电子密度图内二级结构长度相应的?螺旋或?折叠添加在图中,这些二级结构将提供结构的基本骨架。对于一个高质量的电子密度图, 这些区域可作为锚点,进一步按顺序联系到一起,给出多肽链折叠的明确解释。同样,来自于数据库的已有?转角等的模板在此阶段可提供有力的立体化学准则, 特别是对那些建立模型不熟的人。遗憾的是联系二级结构区域的无规卷曲(通常是柔性较高的)与电子密度的对应性很差, 这经常成为结构中不能很好确定的部分。对于一个新构建的结构, 检查它是否合理,最简单而又重要的标准是多肽链折叠不能形成一个结,侧链电子密度与序列较为吻合。也可考察重原子位置在化学性质上是否合理;还可与同源结构相比较,考察其保守残基和二级结构单元的保守性;检查氨基酸类型的环境是否合理,如大多数疏水性的氨基酸应埋在蛋白质核内,这也是一个证明。 结构模型的基础是电子密度图, 记住这一点很重要, 只有电子密度图才能给出真正无偏向的信息,其后的所有东西都存在于其中。如果计算电子密度图没有重大错误的话,在这个阶段敏锐的意识可能是极其重要的。根据电子密度图中可清晰解释的区域构建部分结构(例如蛋白质结构域)可提供其余的相位信息。因而采用相位组合方法(见第八部分)可产生一个更易充分解释的电子密度图。电子密度图解释与修正交替使用已证明是一个很有价值的策略(如参考书58). 用分子置换法解出的结构必须特别小心, 因为在这种情况下的电子密度图从来都是有偏差的。在整个分子置换过程中模型缺省部分(如辅因子)的电子密度图质量,提供了基于MR相位的电子密度图真实信息的客观测量。 8. 修正可以极大地改善蛋白质结构的精度, 因此在蛋白质结构测定中,修正是必不可少的步骤。 然而, 即使有严密的立体化学限制, 观察值对需修正的参数的比例还是太低 (表5), 低于 3A分辨率时,同时修正蛋白质全部原子(非氢原子)的xyz坐标及各向同性B因子是没有意义的。 表5:修正—观察结果与数的比例 分辨率? FMDV 4.0 3.5 3.2 |