标签:
杂谈 |
Introduction to Protein 2D IR Spectroscopy
Carlos R. Baiz, Mike Reppert, Andrei Tokmakoff
MIT, June 1, 2012
1. 概述
2. 背景
Amide I modes
Amide I,
不同肽单元上amide I振动之间的相互作用或者耦合是蛋白质骨架离域化振动的原因
除脯氨酸Proline外,侧链振动与amide I 振动间的作用很弱;
局部Amide I模式(或位点):单个肽单元上的振动
离域化振动:简谐体系中的正则模式,或更一般地称为激发子。正则模式的特征由蛋白质骨架的对称性支配
宽的吸收峰和大量离域模式的存在模糊了amide I谱中的信息。二维红外通过将光谱信息在2个频率轴上展开并计算不同振动之间频率相关性而获取结构信息。
Amide I 红外光谱的结构解释
经验关系:α-helix螺旋 1650附近的单峰;β-sheet片层在1630和1680附近存在2个峰,其中心频率和强度依赖于β strands 的长度和数量;无序结构区域的振动也在1650附近一个很宽的单峰
图2:肌血球素Myoglobin (α-helix), 泛素Ubiquitin(mixed α/β), 伴刀豆蛋白Concanavalin A(antiparallel β-sheet
二维谱可解释为联系一系列激发频率(ω1) 和一系列检测频率(ω3)的二维地图。对角轴表示激发和检测到的频率相同,近似对应于吸收光谱。非对角线上的峰表示激发了某个频率的峰,却检测到了一个不同的发射频率,反映了不同模式间的耦合或者能量传递。作为振动非谐性的结果,谱上每个峰显示为一个“正/负”对。
Myoglobin
Concanavalin
A(antiparallel
Ubiquitin(mixed
α-helices: 模拟发现理想α-helices螺旋有2个主要的红外活性模式,分别有A和E1对称,其中A模式占70%强度, E1模式存在一个大约3.6残基每周期的周期性相位移。A模式随长度增加而红移,从5-10残基的1660到超过20个残基的1650。而E1模式的频率却没有对长度的依赖性。A-E1频率分裂和E1相twist归因于较大的相邻肽单元之间的正耦合,和氢键之间的负耦合。由于A模式引起α-helices中的主要强度,因此对于以α-helices为主的蛋白质可以观察到随螺旋长度而变化的频率。然而这个10cm-1的位移相比于Amide I的~60cm-1的总宽度太小了。极性调节的二维红外实验能够在实验上对21-残基长的螺旋多肽解析这2种模式,发现E1和A模式分别以1638和1650为中心。
3-10 螺旋: 3-10非常类似于α-helices:低频A模式和高频E模式存在10-15的分裂,且随螺旋长度变化而变化。振动圆二色谱和FTIR,以及计算研究显示3-10螺旋比α-helices的峰要红移5-10cm-1。由于峰形宽,通过红外吸收光谱区分二者比较困难,单最近的研究显示amide I的二维红外包含了能够区别于α-helices的3-10螺旋的光谱指纹。
β-sheet:反平行β-sheet由重复的呈矩形的4肽单元构成。对于理想的无限长β-sheet,单个单元的振动即可描述观察到的片层振动。一个包含4个振子反平行片层的单胞可观察到4个不同模式。最低频红外活性模式,承载大部分强度,显示为一个1630-1640附近的窄带,并涉及相邻β股链上位点的同相振动。在此4肽单元中,此模式涉及沿矩形对角线上相对角上单元的同相振动,用υ⊥表示,因为跃迁偶极矩与β股链垂直。高频红外活性模式,υ
平行β-sheet 可由一系列重复的双残基单胞描述。因此,其无限长平行β-sheet的振动光谱将显示2个主要的振动峰。在一个4x4残基的理想片层中,1660附近参出现高频峰,单几乎没有什么强度。振动子的大多强度红移到了低频峰上,在1635附近,被认为是同股链上的残基的不同步振动。
β-turn转角:
实验上很难将β-turn构象的贡献区别开来。因此其指认主要是通过模拟推测的。大致来说,β-turn的峰出现在1680附近。由于β-sheets的υ
Coils无规卷曲:无结构的卷曲在1650-1660附近呈现一个宽的,无特征的峰。由于缺少长程序,卷曲呈现随机耦合模式,可能导致展宽的峰。并且,骨架更容易接触溶剂,导致频位增加,峰进一步加宽。区别α-helices和随机卷曲的困难是amide I红外吸收光谱的缺点。由于随机卷曲有更多的溶剂接触,H/D交换实验和waiting-time实验,结合同位素标定可以帮助指认二级结构。
Doorway Mode Analysis:对蛋白质单个amide I 各模式的直观解释非常困难,一是因为有大量的模式挤在这么小的一段红外区域,且模式间有部分混合特征,单个的振动模式经常在α-helices和β-sheets上离域。第二是因为正则模式的特征是高度动态的,结构和溶剂环境的微小改变可能导致模式的重新组合。所以,尽管正则模式图像提供了描述模型的便利框架,但是单个正则模式对解释光谱的帮助很小。由于同一频域内的正则模式有相似的整体特征,所以可采用doorway mode analysis而不是聚焦于单个模式。简单说,doorway mode analysis依靠奇异值分解(singular value decomposition),对在一个小的频域窗口内的一系列正则模式投射出相同的振动特征。强度加权的组成称为doorway modes,提供了在特定频域内正则模式的特征的直观图像。主要组成模式的特征较少收到结构变化的影响,所以允许同一蛋白不同构象的模式比较,甚至是不同蛋白。
图5显示4个蛋白的模拟光谱,有不同α-helix/β-sheet构象:从50%
二级结构之外:前述基本例子不足以解释所有二维红外中观察到的特征,说明光谱包含更多的与蛋白质的具体结构有关的细节信息。例如,有相似α-helix/β-sheet残基比例的蛋白的二维红外光谱却呈现非常不同的特征,说明蛋白质的三维结构特征包含在光谱中。迄今,超二级模式的光谱指纹仍然大部分未被研究。但是,我们需要更进一步的研究以理解以下问题:扭曲的β-sheet与平坦的理想的β-sheet的光谱有何不同?真实体系中相互接触的平行与反平行β-sheet如何区分?在有多个明确的二级结构中,比如一个卷曲的coil或一个蛋白质多聚体中,有不同的分子间耦合吗?这些是活跃的研究领域。
淀粉样蛋白amyloid和聚集
图6, 胰岛素insulin的光谱描述了多维光谱如何灵敏探测导致蛋白质二聚,多聚和聚集的接触和作用。与单体光谱相比,二聚体光谱线了与β-sheet相关的特征:一个双峰结构和一个更明显的β-ridge,说明了两蛋白质单体间的β-sheet,并说明界面残基保持了无序构象。聚集体和纤维样品显示了双峰模式,但是有不同的中心频率和峰的强度比例,说明聚集体有较大比例的残基在α-helix或无序构象区,而在纤维中,主要特征是有序β-sheet。对这些数据的简单说明虽然是定性的,但是能够帮助我们表征与蛋白质结合和纤维形成有关的结构变化。最近关于淀粉样多肽的研究显示了定量的模拟,结合同位素标定,如何为深入理解蛋白质聚集和纤维形成的机理提供细节。
光谱上隔离的位点:氢键和同位素标定
氢键
同位素标定
图7提供了一个一个12残基的β-hairpin发夹多肽TrpZip2的二维红外光谱,K8位的一个同位素标定揭示了构象不均匀性。K8标定后出现了两个间隔一个氢键(16cm-1)的双峰,这个裂分是由于不同的β-turn构象:K8-1对应一个外凸的圈形构象,其中对溶剂暴露的羰基C=O平均接受2个氢键;而K8-2是属于type-I’类型的,有一个K8-W4内氢键。这个指认是通过分子模拟得出的。这些细小的结构差别反映了振动光谱的精细的结构分辨能力。构象动力学能够从二维峰形中获取,对角方向的峰宽与构象无序度有关,反对角方向则描述分子在该状态采样的时间尺度。K8-2对角峰形宽,说明相对于更加刚硬的K8-W4氢键,暴露于溶剂中的构象的无序度增加。根据预测这两个β-turn构象在毫秒时间尺度内会互相转化。这个例子强调了非线性红外光谱在结构和超快时间分辨能力。
探测蛋白质结构的其它模式:Amide II和侧链振动 (1400-1800 cm-1)
Amide II
其它amide模式
侧链吸收
e.
最近,实验上的研究局部结构和动力学的策略涉及使用非天然侧链。(略)
3. 实验方法
一维和二维红外光谱
红外吸收是电磁场和振动着的分子偶极矩之间相互作用引起的。经典图像中,若分子某一模式的振动与入射光频率相同则发生共振,此模式振幅加大。反过来,振荡的电荷会放出与入射光异相的电磁波,导致破坏性的干涉,产生观测到的吸收峰。大的原子电荷产生强的振荡偶极矩,反过来产生强的吸收峰。
一维红外
二维红外
图9显示了二维红外光谱中所用的脉冲序列。通过在每个时滞τ1之后,将放射信号与一束干涉光重叠,可记录一个干涉图,即可从光谱干涉仪中获得放射信号的幅度和相位。放射信号的频率组成直接在光谱上的检测轴上表示,第1和第2两脉冲之间的时域τ1上的信号的傅立叶变换生成激发频率(ω1)。第2和第3脉冲之间时间延迟τ2被称为等待时间waiting time或分布时间population time,对应于激发和检测事件之间的时间。激发和检测的时间常被称为相干时间(coherence time),因为被测量信号包含了此时间周期内不同状态的相干重叠。
二维红外光谱能够测量的振动模式由载频carrier frequency,持续时间duration,和实验所用飞秒红外脉冲的带宽bandwidth决定。当前商业激光源一般是3-8um(3600-1200cm-1)脉冲长度在50-100飞秒之间,对应带宽50-100cm-1. 为描述这些光源的能力和局限性,图8显示了Ubiquitin和NMA红外吸收光谱,以及典型OPA源的光谱。新的基于等离子体的宽带红外(BBIR)可产生覆盖整个振动光谱直至4000cm-1的红外脉冲。当前,脉冲能过低妨碍了它们作为红外激发光源的使用,但是提供了一条同时探测多个跃迁的新道路。
二维红外光谱是样品复杂三级红外响应的最完备的表示。响应函数的一维投影可以以DPP(dispersive pump-probe), DVE(dispersed vibrational echo), HDVE(heterodyne-detected vibrational echo)信号的形式测量。这些信号包含二维红外光谱的大多数信息,并能投影到单个频率轴上。这比完全二维红外光谱快多了。所以,一些实验比如下面描述的温度跃变(T-jump)实验,使用DPP, HDVE探测动力学变化,而二维红外光谱仅在特定时滞上测取以获得瞬时响应的结构图像。二维光谱是复数量,包括吸收性absorptive和色散性dispersive特征。然而,只给出光谱吸收部分的做法很普遍。色散性的激发-探测(pump-probe)实验,光谱为吸收性的,对应二维红外光谱在图10上ω3检测轴上的投影的实部。复数HDVE谱对应于二维红外光谱在检测轴上投影,尽管一般只画出其实部,等效与DPP谱。
除了激发和检测频率,另外一个重要的光谱变量是四个红外信号的极性polarization,它是指在空间中传播的脉冲静电场的向量的方向,而不是上述样品中一个个振动偶极矩的方向。在特殊的极性产生条件下,我们可以控制四个激发和检测场的极性,用于决定分子内不同跃迁的方向,提供额外的结构信息。两个主要的偏振条件为平行ZZZZ(四个极化的脉冲互相平行)和垂直ZZYY(前两对垂直与后面两个)。平行和垂直极性产生条件分别增强了相对于跃迁偶极矩方向平行或者垂直方向上振动间的交叉峰。两个跃迁偶极矩的角度可以直接从不同极性产生条件下的峰的强度推算出来。
为描述二维红外光谱包含的信息,图11显示了一个模型化合物RDC在正己烷中羰基振动的二维红外光谱。羰基两种伸缩,对称和不对称,产生的尖峰是二维红外光谱中的典型峰带模式。最上面的是吸收光谱,在2014和2084产生2个尖峰,分别对应对称和不对称伸缩振动。在本文语境下,需要澄清“局部模式”(local mode),“正则模式”(normal mode)和“本征状态”(eigenstate)三个术语的区别:局部模式,典型的是与单键振动有关,更重要的是它们构成正则模式的基础;在RDC中,两个局部模式对应于每个端基C≡O键的伸缩。在蛋白质中中,我们所用的amide I局部模式基础对应于每个肽基的C=O伸缩和N-H弯曲振动。局部模式常又称做振动子oscillators或者位点sites。正则模式涉及局部模式的线性组合,每个位点的同相或异相振动子给出每个正则模式以独特的特征,而且,由于这两种表示是线性变换的关系,所以正则模式的数量等于局部模式的数量。在RDC的例子中,两种正则模式分别对应于C≡O振子的同相和异相振动:对称和不对称伸缩。最后,本征态表示的是从振动系统的哈密顿中推导出来的一系列完全正交非谐振动,并常被称为可扰动的正则模式的混合物(perturbative mixtures of the normal modes)。例如,对称和非对称伸缩之间的对称、非对称,和组合态皆为本征态。在正则模式表示下,本征态由每个正则模式量子的数目表示。例如,单重和双重激发的对称伸缩表示为|s>和|2s>,其组合态表示为|as>。在非线性光谱中区别正则模式和本征态很重要,其区别起源于我们希望测量的振动的耦合,也因为光谱是对不同本征态敏感,而不是正则模式间跃迁的频率差别和偶极幅度。
二维红外光谱能够用一个二维地图解释,横坐标为激发频率(ω1),纵坐标为检测频率(ω3),见图11,
对角线上的峰对应于激发和检测频率一致的情形。在对角线下面的峰(3和3')对应于激发
|0>
结构信息从峰的位置和强度中获取,而动力学能够从峰形变化中获取,更具体地,峰的椭圆率,和椭圆率随waiting time的变化。图13显示一个例子,峰形随waiting time变化:在较早的waiting times,峰沿对角方向伸长,因为系综中的每个构象都有不同跃迁频率因而在激发和检测频率之间存在较大的相关。节点线(node lines)作为waiting time的函数而旋转,因为动力学效应引起相关的衰减。频率相关的消失,与样品中分子的频率波动直接关联,称为光谱扩散spectral diffusion。沿对角方向伸长称为非均性展宽(inhomogeneous broadening)。该例说明了锁定在刚性分子内的氢键构型中的残基的动力学比较缓慢,导致较小的频率波动,和一个较慢的节点线旋转,而暴露于溶剂的残基则快速地失去激发和检测之间的相关性。
瞬时温度跃变的二维红外光谱
等待时间二维红外提供亚皮秒时间分辨的结构信息,与此同时,另外一个被发展出来的强大工具将二维红外光谱和非平衡方法结合以研究较长时间尺度的蛋白质折叠、动力学和函数。因为红外光谱产生的是系综测量,这需要一个快速触发事件来同步系综的时间演化。激发(Pump)的时间分辨和探测(Probe)可及的时间尺度常常决定能够被研究的动力学类型。探测Probe的方法,比如二维红外,必须有很高的时间分辨率,很高的结构敏感性,但是更重要的是,反应坐标必须能够容易地映射到光谱坐标上。在蛋白质的研究中,同位素标定常作为选择一系列光谱变量的方法。
常见的触发包括以下几种:1电子激发(10-100fs)以探测超快激发态动力学和光致反应,或作为笼状化合物的光子释放的开关;2. 温度跃变(Temperature-jump)光谱(1-10ns),研究热变性,蛋白质折叠,结合,非平衡动力学;3. 压力跃变(Pressure-jump)(1um),研究压力导致的构象变化,比如部分变性;4. pH-jump方法(100us)以研究pH诱导的构象动力学或者不同蛋白位点的快速质子化;5. 截断流快速混合技术(1-3 ms),探测蛋白质去折叠和变性或混合溶剂诱导的构象变化。其中,只有电子激发和温度跃变方法在超快二维红外光谱报道中介绍过。原则上前述任一技术都能与二维红外探测结合。然而,一个实施上的限制,在于生物样品观测到的非线性信号太弱,不可避免地导致较长的数据收集时间。所以,触发方法必须能够引起较强的信号变化,并和感兴趣的时间尺度相称。这里主要介绍由温度跃变触发的非平衡二维红外光谱技术。
图12是一个温度跃变之后样品的温度剖面的示意图。一个二维红外脉冲序列能够探测从纳秒到毫秒时间尺度上的结构重排。蛋白质动力学发生在不同的时间尺度上,但一般来说纳秒到毫秒的响应时间对应于重排能垒,而100us-1ms发生的跃迁归因于翻越能垒的事件。延迟时间(delay time) 是由温度跃变激光的重复率和样品驰豫限制的。在我们当前的实验中,最大延迟时间是50ms。
温度跃变脉冲必须携带足够的能量以升高溶剂的温度若干度。在我们的实验中,脉冲约为20μm,携带约20mJ的,频率20Hz。最短延迟由温度跃变脉冲宽度(10ns)决定,最长延迟由温度跃变激光器的重复率决定(50ms)。温度跃变脉冲与重水溶剂中的O-D伸缩的泛频共振。温度跃变后,溶剂随热从焦点区域扩散而返回平衡态。温度驰豫曲线为一拉长的指数曲线,时间常数约为3ms。为了获得焦点区的均匀加热,温度跃变脉冲对准样品中~1mm的点,且只有约10%的光被吸收了。产生了大概10度的温度跃升,导致amide I区的传播(transmission)变化了约5%。
试样制备(略)
同位素标定(略)