欢迎来到天天文库
浏览记录
ID:26349889
大小:108.00 KB
页数:12页
时间:2018-11-26
《蛋白质三维结构预测.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第四节蛋白质三维结构预测1、同源模型化方法同源模型化方法是蛋白质三维结构预测的主要方法(Blundell1987)。对蛋白质数据库PDB分析可以得到这样的结论:任何一对蛋白质,如果两者的序列等同部分超过30%(对于排列长度大于80),则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。蛋白质的结构比蛋白质的序列更保守,如果两个蛋白质的氨基酸残基序列有50%相同,那么约有90%的a碳原子的位置偏差不超过3Å。这是同源模型化方法在结构预测方面成功的保证。同源模型化方法的主
2、要思想是:对于一个未知结构的蛋白质,首先通过同源分析找到一个已知结构的同源蛋白质,然后,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。这里的前提是必须要有一个已知结构的同源蛋白质。这个工作可以通过搜索蛋白质结构数据库来完成,如搜索PDB。同源模型化方法是目前一种比较成功的蛋白质三维结构预测方法。从上述方法介绍也可以看出,因为预测新结构是借助于已知结构的模板而进行的,选择不同的同源的蛋白质,则可能得到不同的模板,因此最终得到的预测结果并不唯一。假设待预测三维结构的目标蛋白质为U(Unknown),利用同源模型
3、化方法建立结构模型的过程包括下述6个步骤:(1)搜索结构模型的模板(T)。同源模型化方法假设两个同源的蛋白质具有相同的骨架。为待预测的蛋白质建立模型时,首先按照同源蛋白质的结构建立模板T。所谓模板是一个已知结构的蛋白质,该蛋白质的与目标蛋白质U的序列非常相似。如果找不到这样的模板,则无法运用同源模型法。(2)序列比对。将目标蛋白质U的序列与模板蛋白质序列进行比对,使U的氨基酸残基与模板蛋白质的残基匹配。比对中允许插入和删除操作。(3)建立骨架。将模板结构的坐标拷贝到目标U,仅拷贝匹配残基的坐标。在一般情况下,通过这一
4、步建立目标蛋白质U的骨架。(4)构建目标蛋白质的侧链。可以将模板相同残基的坐标直接作为目标蛋白质的残基坐标,但是对于不完全匹配的残基,其侧链构象是不同的,需要进一步预测。侧链坐标的预测通常采用已知结构的经验数据,如ROTAMERS数据库(Janinetal.,1978;PonderandRichards,1987)。ROTAMERS含有所有已知结构蛋白质中的侧链取向,按下述过程来使用ROTAMER:从数据库中提取ROTAMER分布信息,取一定长度的氨基酸片段(对于螺旋和折叠取7个残基,其它取5个残基);在U的骨架上平
5、移等长的片段,从ROTAMER库中找出那些中心氨基酸与平移片段中心相同的片段,并且两者的局部骨架要求尽可能相同,在此基础上从数据库中取局部结构数据。(5)构建目标蛋白质的环区。在第2步的序列比对中,可能加入空位,这些区域常常对应于二级结构元素之间的环区,对于环区需要另外建立模型。一般也是采用经验性方法,从已知结构的蛋白质中寻找相应的环区,拷贝其结构数据。如果找不到相应的环区,则需要用其它方法(Colluraetal.,1993)。(6)优化模型。通过上述过程为目标蛋白质U建立了一个初步的结构模型,在这个模型中可能存在
6、一些不相容的空间坐标,因此需要进行改进和优化,如利用分子力学、分子动力学、模拟退火等方法进行结构优化。对于具有60%等同的序列,用上述方法所建立的三维模型非常准确。若序列的等同部分超过60%,则预测结果将接近于实验得到的测试结果。一般如果序列的等同部分大于30%,则可以期望得到比较好的预测结果。当然,这种计算方法要占用大量的计算时间,主要是由于第4步的数据库搜索过程耗时较多。如果序列的等同部分小于30%或更少,那么预测结果的准确性如何呢?随着U和T的相似度降低,比对这两个蛋白质序列所需插入的环(LOOPS)增多。为环
7、区建立精确的三维模型意味着解决结构预测的问题。有许多具体的方法可用于为环区建立三维模型,其中最好的方法在一些情况下能够得到环区正确的取向。为环区建立三维模型的一种方法是分子动力学模拟。由于环区一般来说相对比较短,可以用分子动力学方法来模拟,但在动态模拟过程所需要的计算时间随着多肽链的残基数指数增长。然而,即使序列等同部分下降到25%-30%,同源模型化方法也能产生出未知结构蛋白质整体折叠的粗糙模型。对于这样初始模型可以进行优化。常常用分子动力学技术进行优化,以提高精度。通过分子动力学的进一步模拟,往往能够得到较好的结
8、果。也可以用人工神经网络(如BP网)来预测同源蛋白质的空间结构。Bohr等人曾利用BP网预测同源蛋白质的折叠模式(Bohretal.,1990),该方法应用距离点矩阵表示蛋白质的结构,同源蛋白质的距离矩阵相似。沿水平轴和垂直轴画出蛋白质序列,如果两个氨基酸Ca原子之间的距离小于指定的距离,则在矩阵对应位置打上点标记。与二级结构预测的神经网络方法
此文档下载收益归作者所有