ExPASy是Expert Protein Analysis
System的缩写,从字面理解即为专业蛋白质分析系统.从取名就可以看出网站背后的牛人们的气势和专业精神。ExPASy由瑞士生物信息学研究所维护(Swiss Institute of Bioinformatics
),提供从序列(Swiss-Prot)到结构(Swiss-Model),以及2-D
Page等蛋白质操作相关的全套服务。我们强烈的推荐ExPASy作为您分析序列的第一站。
这是一个ExPASy汇总的蛋白质组学在线实用分析工具包,涉及蛋白分类、翻译、结构预测、相似检索、序列比对等等,如果您要做相关的分析,这里一定不会让您失望。这个工具包一直都在更新,其中有一小部分工具是ExPASy自己开发和维护的。
共分成了12大类,以下是分类列表:
[Protein identification and characterization]
[DNA -> Protein]
[Similarity searches]
[Pattern and profile searches]
[Post-translational modification prediction]
[Topology prediction]
[Primary structure analysis]
[Secondary structure prediction]
[Tertiary structure]
[Sequence alignment]
[Phylogenetic analysis]
[Biological text analysis]
PROSITE是个老牌数据库了,在90年代初期开始构建第一个蛋白质序列二次数据库,现由瑞士生物信息学研究所SIB维护。目前是Release 19.24, of 04-Apr-2006 (contains
1410 documentation entries that describe 1332 patterns, 4 rules and
605 profiles/matrices)。
从网上找了一些较好的介绍放在这里:Protsite数据库是基于对蛋白质家族中同源序列多重序列比对得到的保守性区域,这样区域通常与生物学功能有关,例如酶的活性位点、配体或金属结合位点等。因此,Prosite数据库实际上是蛋白质序列功能位点数据库。通过对Prosite数据库的搜索,可判断该序列包含什么样的功能位点,从而推测其可能属于哪一个蛋白质家族。Prosite数据库实际上包括两个数据库文件,一个为数据文件即Prosite,该文件给出了能进行匹配的序列及序列的详细信息。另一个为说明文件
PrositeDoc,PrositeDoc说明文件中给出该序列模式的生物学功能及其文献资料来源。Prosite数据库使用正则表达式来表示序列模式,例如:[GSK]-F-x(2)-[LIVMF]-x(4)-[RKEQA]-x(2)-[RST]-x-[GA]-x-[KN]-P-x-T.这里,方括号中为可选残基,如第一个方括号[GSK]中3个残基中甘氨酸G、丝氨酸S和赖氨酸L中的任意一个均可出现。x(2)表示可以有两个任意残基。因此,序列片段GFxxLxxxxRxxRxGxKPxT是其中一种可能的模式。
Prosite数据库基于多序列比较得到的单一保守序列片段,或称序列模体。除Prosite外,蛋白质序列二次数据库还有蛋白质序列指纹图谱数据库Prints(Attwood,
1998)、蛋白质序列模块数据库Blocks(Henikoff,
1998)、蛋白质序列家族数据库Pfam(Sonnhammer,
1998)、蛋白质序列谱数据库Profile、蛋白质序列识别数据库Identify等[链接1.2.5.2]。这些数据库的共同特点是基于多序列比对,它们的不同之处是处理比对结果的原则和方法,Prints和Blocks利用了序列中的多重保守片段,Profiles着眼于构建序列概貌库,而
Pfam采用了隐马氏模型,Identify则利用模糊正则表达式的概念。应该说,这些方法各有一定的特色。以下是一些介绍:
http://www.37c.com.cn/topic/004/netguide/netguide01.asp?filename=prosite.htm
http://www.cbi.pku.edu.cn/chinese/documents/bioinfor/overview/web5/5.html
SWISS-2DPAGE
SWISS-2DPAGE数据库是由日内瓦大学附属医院临床化学中心实验室与瑞士生物信息协会合作创办的人类两维凝胶蛋白数据库。为在2D凝胶上预测蛋白质迁移提供了许多标化的凝胶图象和工具。
比较已知细胞类型或组织的凝胶和SWISS-2DPAGE的图象集可以帮助识别关键标志物,但是实际上详细的比对低到中等丰度的蛋白质有困难,除非凝胶在同一实验室中在严格控制的条件下跑胶。其难度是由于蛋白质样品本身的变化性、样品制备的不可重复性以及任何凝胶系统不能完全分辨样品中的所有蛋白质。MS有希望帮助排除凝胶对凝胶方式比对的需要
The
SWISS-MODEL Repository of annotated three-dimensional protein
structure homology models .
SWISS-MODEl库收录蛋白质注释三维比较结构模型,这些模型在SWISS
-MODEL全自动同源造模过程下生成。现该库包含大约30万个采自Swiss-Prot
和
TrEMBL数据库的三维定序模型。其内容定期更新,以收录新的痱序及新的可用模板。它反映了当今基本造模运算法则的进展。数据库条目下有一个或更多的三维蛋白质模型,叠合的模板结构和相应建模队列,还包括建模过程的一些总结摘要及建立在力场基础上的质量评估。SWISS-MODEL库在其主页上可以和大家互动沟通。与其它数据库如Swiss-Prot
可以实现无缝链接。
加载中,请稍候......