蛋白质结构预测方法综述.pdf

蛋白质结构预测方法综述.pdf

ID:57282583

大小:137.16 KB

页数:8页

时间:2020-08-09

蛋白质结构预测方法综述.pdf_第1页
蛋白质结构预测方法综述.pdf_第2页
蛋白质结构预测方法综述.pdf_第3页
蛋白质结构预测方法综述.pdf_第4页
蛋白质结构预测方法综述.pdf_第5页
资源描述:

《蛋白质结构预测方法综述.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、蛋白质结构预测方法综述卜东波陈翔王志勇《计算机不能做什么?》是一本好书,其中文版序言也堪称佳构。在这篇十余页的短文中,马希文教授总结了使用计算机解决实际问题的三步曲,即首先进行形式化,将领域相关的实际问题抽象转化成一个数学问题;然后分析问题的可计算性;最后进行算法设计,分析算法的时间和空间复杂度,寻找最优算法。蛋白质空间结构预测是很有生物学意义的问题,迄今亦有很多的工作。有意思的是,其中一些典型工作恰恰是上述三步曲的绝好示例,本文即沿着这一路线作一总结,介绍于后。1背景知识生物细胞种有许多蛋白质(由20余种氨基酸所形成的长链),这些大分

2、子对于完成生物功能是至关重要的。蛋白质的空间结构往往决定了其功能,因此,如何揭示蛋白质的结构是非常重要的工作。生物学界常常将蛋白质的结构分为4个层次:一级结构,也就是组成蛋白质的氨基酸序列;二级结构,即骨架原子间的相互作用形成的局部结构,比如alpha螺旋,beta片层和loop区等;三级结构,即二级结构在更大范围内的堆积形成的空间结构;四级结构主要描述不同亚基之间的相互作用。经过多年努力,结构测定的实验方法得到了很好的发展,比较常用的有核磁共振和X光晶体衍射两种。然而由于实验测定比较耗时和昂贵,对于某些不易结晶的蛋白质来说不适用。相比

3、之下,测定蛋白质氨基酸序列则比较容易。因此如果能够从一级序列推断出空间结构则是非常有意义的工作。这也就是下面的蛋白质折叠问题:1蛋白质折叠问题(ProteinFoldingProblem)输入:蛋白质的氨基酸序列输出:蛋白质的空间结构蛋白质结构预测的可行性是有坚实依据的。因为一般而言,蛋白质的空间结构是由其一级结构确定的。生化实验表明:如果在体外无任何其他物质存在的条件下,使得蛋白质去折叠,然后复性,蛋白质将立刻重新折叠回原来的空间结构,整个过程在不到1秒种内即可完成。因此有理由认为对于大部分蛋白质而言,其空间结构信息已经完全蕴涵于氨基

4、酸序列中。从物理学的角度讲,系统的稳定状态通常是能量最小的状态,这也是蛋白质预测工作的理论基础。2蛋白质结构预测方法蛋白质结构预测的方法可以分为三种:同源性(Homology)方法:这类方法的理论依据是如果两个蛋白质的序列比较相似,则其结构也有很大可能比较相似。有工作表明,如果序列相似性高于75%,则可以使用这种方法进行粗略的预测。这类方法的优点是准确度高,缺点是只能处理和模板库中蛋白质序列相似性较高的情况。从头计算(Abinitio)方法:这类方法的依据是热力学理论,即求蛋白质能量最小的状态。生物学家和物理学家等认为从原理上讲这是影响

5、蛋白质结构的本质因素。然而由于巨大的计算量,这种方法并不实用,目前只能计算几个氨基酸形成的结构。IBM开发的BlueGene超级计算机,就是要解决这个问题。穿线法(Threading)方法:由于AbInitio方法目前只有理论上的意义,Homology方法受限于待求蛋白质必需和已知模板库中某个蛋白质有较高的序列相似性,对于其他大部分蛋白质来说,有必要寻求新的方法。Threading就此应运而生。以上三种方法中,AbInitio方法不依赖于已知结构,其余两种则需要已知结构的协助。通常将蛋白质序列和其真实三级结构组织成模板库,待预测三级结构

6、的蛋白质序列,则称之为查询序列(querysequence)。3蛋白质结构预测的Threading方法Threading方法有三个代表性的工作:Eisenburg基于环境串的工作、XuYing的Prospetor和XuJinbo、LiMing的RAPTOR。Threading的方法:首先取出一条模版和查询序列作序列比对(Alignment),并将模版蛋白质与查询序列匹配上的残基的空间坐标赋给查询序列上相应的残基。比对的过程是在我们设计的一个能量函数指导下进行的。根据比对结果和得到的查询序列的空间坐标,通过我们设计的能量函数,得到一个能量

7、值。将这个操作应用到所有的模版上,取能量值最低的那条模版产生的查询序列的空间坐标为我们的预测结果。需要指出的是,此处的能量函数却不再是热力学意义上的能量函数。它实质上是概率的负对数,即E=−logp,我们用统计意义上的能量来代替真实的分子能量,这两者有大致相同的形式。如果沿着马希文教授的观点看上述工作,则更有意思:Eisenburg指出如果仅仅停留在简单地使用每个原子的空间坐标(x,y,z)来形式化表示蛋白质空间结构,则难以进一步深入研究。Eisenburg创造性地使用环境串表示结构,从而将结构预测问题转化成序列串和环境串之间的比对问题

8、;其后,XuYing作了进一步发展,将蛋白质序列表示成一系列核(core)组成的序列,Core和Core之间存在相互作用。因此结构就表示成Core的空间坐标,以及Core之间的相互作用。在这种表示方法的基础

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。