蛋白二级结构的预测方法
(2018-08-31 10:27:25)
标签:
大学教育科技文化生物 |
预测蛋白质二级结构的算法大多是根据已知结构的蛋白质,用过人工神经网络、遗传算法等技术构建预测方法。一般α 螺旋的预测较为准确,β
折叠次之,而其它无规则二级结构则更差。
1. 反馈式神经网络算法
通常是由三层相同的神经元构成的层状网络,使用反馈式学习规则,底层为输入层,中间为隐含层,顶层是输出层,信号在相邻各层间逐层传递,不相邻的各层间无联系,在学习过程中根据输入的一级结构和二级结构的关系的信息不断调整各单元之间的权重,最终目标是找到一种好的输入与输出的映象,并对未知二级结构的蛋白进行预测。神经网络方法的优点是应用方便,获得结果较快较好,主要缺点是没有反映蛋白的物理和化学特性,而且利用大量的可调参数,使结果不易理解。
PHD用的就是神经网络算法,返回的结果包含每个残基位点的预测可信度。平均预测准确率据说达到 72%。
nnPredict也利用了神经网络方法,返回的结果包括“H”(螺旋)、“E”(折叠) 和“-”(转角)。这个方法对全 α蛋白能达到 79%的准确率。
2.
GOR方法不仅考虑被预测位置本身氨基酸残基种类对该位置构象的影响,也考虑到相邻残基种类对该位置构象的影响。这样使预测的成功率提高到 65% 左右。GOR方法的优点是物理意义清楚明确,数学表达严格,而且很容易写出相应的计算机程序,但缺点是表达式复杂。
3. 同源性比较法
根据与已知结构蛋白的比较,通过其同源蛋白的结构得到靶蛋白的结构。如果靶序列和已知结构序列在整个序列的全长有很高的相似性,在合理的信任度上,我们可以使用已知结构作为靶蛋白质的模版。
还有很多其他的不同算法,比如Chou-Fasman算法、多序列列线预测等。