[转载]蛋白疏水分析、跨膜区预测以及拓扑结构的生化分析

标签:
转载 |
本文为Atom原创,特此说明
内容概要
1、蛋白疏水性计算机分析和跨膜结构预测
(这部分本人绝对外行,只介绍几个我曾经用过的方法)
1.1
Kyte and
Doolittle疏水分析
1.2
Helical wheel分析Amphiphilic肽段
1.3
alpha螺旋穿膜区的预测
2、膜蛋白拓扑结构的生化分析
2.1
原核细胞:Enzyme
Tags
2.2
真核细胞:Glycosylation
Tags
2.3
Cysteine Scanning
2.4 BAD
Tag
2.5
蛋白酶保护分析
---------------------------------------------------------------------------------------
1、蛋白疏水性计算机分析和跨膜结构预测
由双层脂类组成的生物膜结构是细胞的基本构成单元,然而,生物膜的大部分功能是由镶嵌在生物膜中的蛋白质来完成的,膜蛋白决定了生物膜的功能特性,因此,不同类型的生物膜,其蛋白构成比例有很大的差别,以质量来算,从25%到75%不等。另一个角度来说,生物体内的蛋白质中,20-30%都属于膜蛋白,因此膜蛋白在细胞的功能中占据重要地位是显而易见的。由于膜蛋白很难得到大量外源表达,纯化、结晶也非常困难,所以得到结晶X线衍射明确其结构的膜蛋白至今仍然很少,目前对于膜蛋白的结构研究,仍然处于起步阶段。
膜蛋白包括integral
membrane protein和peripheral membrane
1.1
1982
年Kyte和Doolittle发表在Journal of Molecular Biology上的分析蛋白疏水特性的方法,(A Simple Method
for
我试过许多不同软件,没有找到一个满意的,也就是可以输出发表格式图形的软件,最后只好通过拷屏的方法拼凑打印成图形发表。如果哪位朋友发现比较好的软件可以直接输出图形,特别是要输出高dpi的图形,麻烦你告诉大家共享。
引用:最初由 zhengz 发布
谢谢了,看了后对这个有点懂
了,以前自己用dnastar做了一个类似
还有文献中提到关于氨基酸的二级结构和一些物理性质的预测,具有较大的价值,具体的与真实结构的吻合率有多高?
我前面说过,我在这方面是外行,所以具体原理我闹不太明白的。根据我自己的理解,氨基酸的疏水值是由这个氨基酸从脂相进入水相所需要的能量(free
说到预测的准确性,我就不知道该用什么概率了。我自己是这样看的:即使预测准确性达到99%,也仍然是预测,你也不能保证你的蛋白质不会落到例外的1%里面。所以,预测本身只能帮助你分析,帮助实验设计,但是你不能依赖预测来出结果,预测和生化、衍射或者MRI实验结果相符合时,你才能说它是准确的,如果不符合,可能还要分析一下原因,但是仍然以实验为准。我从来没有看到通过预测就可以写出文章来的,除非是讲预测方法学的文章,
因此,特别要说明,我这个主题的重点应该是在生化分析那部分。
1.2 Helical wheel分析Amphiphilic肽段
Amphiphilic
(或者称为Amphipathic)是指某些肽段,在形成alpha螺旋以后,氨基酸侧链一边是亲水的,另一边是疏水的,这样疏水这边就形成了一个叫做
因为alpha-helix每3.6个氨基酸形成一个螺旋,在蛋白一级结构系列中,Amphiphilic(Amphipathic)螺旋,是无法分析出来的,这种结构的预测需要绘制helical
这是一个假想的肽段,从一级结构来看,有数个
Helical
Wheel绘制的软件很多,除了前面说到的dnastar, peptools外,通过google搜索helical
1.2
前面已经写完了疏水区的预测,蛋白跨膜区预测的最重要基础实际上就是疏水区预测,但是跨膜区以及跨膜拓扑结构的预测比这要复杂得多,我说过我在这方面是外行,很幸运,今天找到了一篇去年的综述,内容非常全面,包括spiro提到的几个方法都有介绍,我就偷懒了(另一方面也是避免露馅),直接把这篇综述贴上来给大家一起学习吧。当然,你想偷懒看中文就没戏了,不过真正有兴趣的朋友一定不会错过这篇文献的。
这里是摘要:
Abstract:
Membrane proteins are crucial for many biological functions and
have become attractive targets for pharmacological agents. About
10%-30% of all proteins contain membrane-spanning helices. Despite
recent successes, high-resolution structures for membrane proteins
remain exceptional. The gap between known sequences and known
structures calls for finding solutions through bioinformatics.
While many methods predict membrane helices, very few predict
membrane strands. The good news is that most methods for helical
membrane proteins are available and are more often right than
wrong. The best current prediction methods appear to correctly
predict all membrane helices for about 50%-70% of all proteins, and
to falsely predict membrane helices for about 10% of all globular
proteins. The bad news is that developers have seriously
overestimated the accuracy of their methods. In particular, while
simple hydrophobicity scales identify many membrane helices, they
frequently and incorrectly predict membrane helices in globular
proteins. Additionally, all methods tend to confuse signal peptides
with membrane helices. Nonetheless, wet-lab biologists can reach
into an impressive toolbox for membrane protein predictions.
However, the computational biologists will have to improve their
methods considerably before they reach the levels of accuracy they
claim.
我的主要内容在后面的生化分析,但是可能会拖比较长的时间才能完成,请大家谅解。
2、膜蛋白拓扑结构的生化分析
所谓膜蛋白拓扑结构,实际上就是描述一个跨膜蛋白有几个跨膜区,这些跨膜区是由里向外,还是由外向里,N端和C端分别是在膜内还是在膜外。对于原核生物,因为没有胞内膜系统,跨膜,实际上就是跨细胞膜,对于真核生物,情况复杂一些,不过规律是一样的,值得注意的是,从拓扑结构来说,内质网的外侧等同于细胞内,而内质网的囊腔(lumen)则相当于细胞膜外侧,这一点在分析真核细胞拓扑结构时一定要搞清楚,因为跨膜蛋白合成一般都是在内质网完成,蛋白合成的同时即实现跨膜转移,所以真核细胞的拓扑结构生化分析通常是用内质网系统来进行的。
跨膜结构的生化分析,通常以计算机预测作为实验设计的基础。由于生物膜的的相对不通透性,膜两侧出现不同的分隔区,如果在预测的跨膜片段前、后附加适当标记,这个标记出现在膜内或者膜外将会有不同的生化表现,就可以验证预测的跨膜区是否真正的跨膜片段,而且可以知道这个片段的跨膜方向(N-in,
2.1 原核细胞:Enzyme
Tags
用大肠杆菌做研究模型,目前已经有三种酶可以作为标记,用来研究蛋白跨膜结构,这三种酶是:碱性磷酸酶(PhoA),beta-galactosidase
根据以上这些酶的特点,实验设计通常是这样的:根据计算机预测结果,在预测跨膜区的前面或者后面选择一个点中断(truncate)目的蛋白质的肽链,然后与以上三个酶之一形成融合蛋白,这叫做C-terminal
融合蛋白的表达,当然是通过质粒DNA重组的方式实现的。特别需要提到的是,因为PhoA和Bla两个蛋白本身就是分泌蛋白,他们的原始系列里面是有跨膜信号肽的,设计融合蛋白的时候,这个信号肽当然不能包括进来,所以在融合蛋白里面的PhoA和Bla氨基酸系列,实际上是成熟蛋白(mature
得到含有重组子的细菌以后,首先要通过western
除了C-terminal
deletion fusion方法以外,还有人用夹心法融合(sandwich
总的来说,无论是C-terminal
deletion fusion 还是 sandwich
1、LacZ的活性表现在细胞内,因此只有被转运到细胞外才会失活,如果细胞跨膜转运机制出现饱和(saturation
of export
2、融合位点的设计,应该离跨膜区远一些,一般可以设计在下一个跨膜区的前面(C-terminal
end of cytoplasmic
3、如果一个出膜信号的氨基酸序列中有一些亲水氨基酸存在,这个出膜信号可能不够强,融合在这个出膜信号后面的PhoA或者Bla会无法被转运,因此出现阴性结果,对于这种跨膜结构的分析需要特别谨慎。另外一种情况是,示意图中的B-2,虽然其N端是在膜外的,但是这种出膜信号无法通过C-
4、对于有些穿膜信号,可能只要其中某一部分就已经可以完成跨膜任务,因此融合位点的设计可以在跨膜区中间,这种设计用于PhoA标记的研究,有时候可以准确分析跨膜区的中间点,因为融合到跨膜区的不同位点,将得到一系列不同强度的酶活性,因此而推断出整个跨膜区序列,这种方法要求对PhoA进行定量分析。
总之,通过酶标记融合蛋白的方法研究膜蛋白的拓扑结构是一个很有实用价值的方法,结合计算机预测的结果进行实验设计和分析,往往可以得到大多数膜蛋白的正确结构。但是少数情况下会出现一些异常结果,如果和预测的结果不符合,就需要增加融合位点,采用不同酶标,或者用其他一些方法来进一步分析。还要特别说明的是,尽管酶标记的方法是用大肠杆菌做实验模型,但是,对于真核细胞的跨膜蛋白分析,同样也可以用这个系统来实现,因为大肠杆菌实验条件要求相对于真核细胞实验来说要简单得多,用于真核蛋白的研究仍然不失为一个很好的手段。对于一些融合蛋白,其跨膜表现和天然蛋白不同,虽然会影响膜蛋白结构的研究,然而另一方面,深入分析这些不同,也可能会发现跨膜信号的形成机制中我们还没有认识到的东西,从而改进膜蛋白跨膜结构的研究方法。
2.2 真核细胞:Glycosylation
Tags
糖基化在真核细胞膜蛋白翻译后修饰中是一个普遍现象,糖基结合位点在NXT/S保守序列的Asn侧链氨基上,这个修饰是由寡糖基转移酶
用糖基化标记研究跨膜蛋白的拓扑结构也有两种不同策略,即C-terminal
deletion fusion和Sandwich
C-terminal
deletion
fusion方法几乎和PhoA融合蛋白完全一样,通常选一个肯定会发生糖基化的多肽区域(这个标记片段往往根据实验室的方便来选择,可以根据自己手头已经有的蛋白,选一个区域来作为标记),融合到要研究的蛋白质某个位点(膜内或者膜外区)C末端,在体外翻译系统中,加入内质网系统(Microsome)
糖基化扫描的实验设计相对复杂一些,通常是选择一个相对比较短的(甚至只有三个氨基酸NXS,一个糖基化位点或者四个氨基酸NNSS,两个糖基化位点)标记,插入膜内或者膜外区域某个点中间,通过设计一系列的突变体,标记蛋白质不同区域(即扫描),为了保证这个位点是蛋白序列的唯一糖基化位点,先必须通过
1、糖基化位点与跨膜区的距离:因为OST的催化基团与细胞膜本身有一定空间距离,如果糖基化位点太接近蛋白跨膜区,这个位点和催化基团无法接触,将不会发生糖基化。实验证明,糖基化区域的细胞内环至少需要30个氨基酸,其中与上游(N端)跨膜区距离必须超过14个氨基酸,与下游(C端)跨膜区距离须超过
2、如果突变、标记以后蛋白质不具有功能,说明蛋白质的折叠可能发生了变化,糖基化标记得到的信息即有可能是错误的。当然也有人认为,如果蛋白质折叠发生错误,将在进入细胞膜以前即被蛋白酶消化而降解,所以只要能得到膜蛋白表达,大多数情况下其结果都是可靠的,如果标记蛋白功能正常(或者保持部分功能),糖基化扫描的结果将是非常有说服力的。
3、由于糖基化受蛋白空间结构、催化位点与糖基化位点相互作用等因素影响,虽然糖基化阳性说明标记位点在膜外,糖基化阴性却不能完全排除其在膜外的可能性,阴性结果必须得到其他实验的验证。
糖基化标记法虽然是通过真核细胞翻译系统进行实验,但是原核细胞的蛋白如果在这个系统中翻译表达,同样可以发生糖基化,所以这个方法用于原核细胞的跨膜蛋白研究,也有成功的报道。
2.3 Cysteine Scanning 半胱氨酸扫描实验
半胱氨酸是一个非常特殊的氨基酸,它的巯基是一个活跃基团,在蛋白折叠、多聚体形成以及酶活性中心里面都扮演重要角色。在细胞跨膜蛋白分析中,利用巯基容易受化学修饰的特性,通过标记的巯基修饰试剂来分析半胱氨酸的位置,这个实验也多半在大肠杆菌体系完成(对于真核细胞,目前只能用于研究细胞膜的蛋白,不能研究表达于细胞器膜上的蛋白),其原理也非常简单,在完整细胞中,有些巯基修饰剂不能穿透细胞,因此只能和膜外侧的巯基发生反应,给巯基修饰剂带上标记
由于半胱氨酸可能出现于蛋白原始的序列中,所以实验第一步是必须得到一个没有半胱氨酸的突变蛋白,通常把蛋白序列里的所有氨基酸都要突变成侧链是羟基的丝氨酸,然后检测该突变蛋白的功能,如果突变蛋白有一定功能,说明突变本身没有破坏蛋白的基本结构,那么半胱氨酸扫描实验就可以顺利进行了。
半胱氨酸扫描,就是在蛋白质的不同位点,将某个氨基酸突变成为半胱氨酸,每次只突变一个位置,产生一系列的突变蛋白,也就是用突变的半胱氨酸扫描蛋白系列,这些突变体分别在大肠杆菌表达,通过分析其受化学修饰的结果情况,判断不同位置的氨基酸在细胞膜两侧的相对位置,就可以得到整个蛋白的拓扑结构图。由于半胱氨酸对蛋白特性干扰比较少,通常情况下,可以得到有部分甚至全部功能的cysteine-less蛋白突变体,而且半胱氨酸扫描只改变蛋白结构中的一个氨基酸,蛋白系列中的大多数氨基酸,突变成半胱氨酸以后对蛋白功能也不会有太大的影响,万一有影响,还可以设计突变附近的其他氨基酸,另外,由于化学修饰是在翻译、修饰并折叠完成的成熟蛋白上进行的,所以,半胱氨酸扫描在膜蛋白拓扑结构研究中,得到的结果可能是最准确的。
目前最常用的巯基修饰试剂是maleimide的衍生物(参考示意图),例如文献中报告的有:可穿透细胞膜的[14C]NEM
还要注意的一点是,正常细胞膜上表达许多不同蛋白,都可能有巯基存在,因此化学修饰总是会在许多膜蛋白上发生,进行半胱氨酸扫描实验,必须做免疫沉淀分离特异蛋白才能进行结果分析。
半胱氨酸扫描分析蛋白跨膜结构的基本过程是:
1、设计cysteine-less突变蛋白,进行基因重组表达
2、检测cysteine-less蛋白的功能,至少要保留部分功能
3、在cysteine-less突变蛋白的基础上,构建一系列突变体进行氨基酸序列扫描
4、在大肠杆菌分别表达突变体
5、设计不同组合的化学修饰方法,对一系列表达突变蛋白的菌株进行化学修饰实验
6、溶解细菌,用目的蛋白特异的抗体做免疫沉淀
7、SDS-PAGE分离IP产物
8、检测蛋白标记情况,分析跨膜拓扑结构
就目前的论文发表情况来看,如果能够选择一个比较有意义的跨膜蛋白,完成半胱氨酸扫描,得到蛋白拓扑结构,并且把蛋白的跨膜结构和其生物功能联系起来分析得到合理的解释,基本上发一篇JBC的论文应该还是没有问题的。不过半胱氨酸扫描突变蛋白构建工作量非常大,还有大量的功能分析实验要完成,这个工作也没有想象的那么简单。
最后提醒一点,如果得到一系列半胱氨酸扫描的蛋白都是有功能的,这些突变蛋白还可以用于蛋白的生物物理实验,分析蛋白空间构相、功能基团等等,我对这个方面了解甚少,仅仅提醒大家而已,有兴趣的朋友可以自己进一步学习。
http://s12/mw690/002zjnA7zy7lcg3sgqf6b&690
2.4 BAD
Tag
BAD
是Biotin
Acceptor
由于biotin
不过,BAD融合蛋白也有一个缺点,它不能做夹心法融合,由于BAD影响空间构相,除非夹心蛋白功能正常,否则不能得到准确结果。检测融合蛋白是否生物素化是很简单的,我们做组化实验时常用的HRP-Avidin就可以直接用于特异识别生物素,然后通过显色或者化学发光法检测蛋白。BAD
2.5 蛋白酶保护分析
蛋白质通常都有许多特异或者非特异的蛋白酶位点,跨膜蛋白序列中,跨膜区本身位于双层脂质内,因此受到保护而不会被蛋白酶消化。不过对蛋白跨膜结构分析有意义的是,在正常菌体细胞,当细胞膜完整时,胞浆内蛋白会受到保护,对于真核细胞内质网的蛋白,则是囊腔内的蛋白将受到保护。通过体外分离细胞膜并且在一定条件下重新悬浮,可以产生inside
我手头现在就在做一个膜蛋白,N端有6-His标记,在标记的下游(C端侧)有一个endokinase位点Xpress标记,计算机预测跨膜区不甚明确,不过即使有也只能出现在这个EK位点下游。我通过PhoA融合蛋白法已经证明蛋白的C末端是在胞浆内的,但是无法确定N末端是否被转出胞外,目前我正在设计两个实验,一是用proteinase
常用的TM预测server
转自spiro:
跨膜区结构预测
Method
Server
ALOM
psort.nibb.ac.jp/form.html
HMMTOP
www.enzim.hu/hmmtop
MEMSAT
www.psipred.net
KD
fasta.bioch.virginia.edu/fasta/grease.htm
PHDhtm
cubic.bioc.columbia.edu/predictprotein
SOSUI
sosui.proteome.bio.tuat.ac.jp/
SPLIT
www.mbb.ki.se/tmap/index.html
TMAP
www.mbb.ki.se/tmap/index.html
TMHMM
www.cbs.dtu.dk/services/TMHMM-2.0