生物信息学-chapter7_2

ID：39756147

大小：628.00 KB

页数：37页

时间：2019-07-10

资源描述：

《生物信息学-chapter7_2》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、第七章-2蛋白质结构预测主讲人：孙啸制作人：刘志华东南大学吴健雄实验室结构预测流程ProteinsequenceDatabasesimilaritysearchDoessequencealignwithproteinofknown3Dstructure?Proteinfamily,domain,clusteranalysisRelation-shiptoknownstructure?Structuralanalysis3DcomparativemodelingPredictedthreedimensionalstructureIsthe

2、reapredictedstructure?3Danalysisinlaboratoryyesnonono第四节蛋白质三维结构预测1、同源模型化方法主要思想：对于一个未知结构的蛋白质，找到一个已知结构的同源蛋白质，以该蛋白质的结构为模板，为未知结构的蛋白质建立结构模型。依据：任何一对蛋白质，如果两者的序列等同部分超过30%，则它们具有相似的三维结构，即两个蛋白质的基本折叠相同，只是在非螺旋和非折叠区域的一些细节部分有所不同。假设待预测三维结构的目标蛋白质为U（Unknown），利用同源模型化方法建立结构模型的过程包括下述6个步骤：（1）

3、搜索结构模型的模板(T)（2）序列比对（3）建立骨架（4）构建目标蛋白质的侧链（5）构建目标蛋白质的环区（6）优化模型UT构建目标蛋白质的侧链预测结果准确率：对于具有60%等同的序列，用上述方法所建立的三维模型非常准确。若序列的等同部分超过60%，则预测结果将接近于实验得到的测试结果。一般如果序列的等同部分大于30%，则可以期望得到比较好的预测结果。2、线索化方法（折叠识别方法）有很多蛋白质具有相似的空间结构，但它们的序列等同部分小于25%，即远程同源。对于这类蛋白质，很难通过序列比对找出它们之间的关系，必须设计新的分析方法。对于一个

4、未知结构的蛋白质（U），如果找到一个已知结构的远程同源蛋白质（T），那么可以根据T的结构模板通过远程同源模型化方法建立U的三维结构模型。UT（远程同源）一个远程同源模型化方法要解决三个问题：（1）检测远程同源蛋白质（T）；（2）U和T的序列必须被正确地对比排列；（3）修改一般的同源模型化过程，以应用于相似度非常低的情况，即处理更多的环区，建立合理的三维结构模型。如何解决第一个和第二个问题？基本思想是建立一个从U到已知结构T的线索，并通过一些基于环境或基于知识的势，评价序列与结构的适应性。至于最后建立三维结构模型则是非常困难的序列→结构

5、比对线索化的主要思想：利用氨基酸的结构倾向（如形成二级结构的倾向、疏水性、极性等），评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。建立序列到结构的线索的过程称为线索化，线索技术又称折叠识别技术。线索化或者折叠识别的目标是为目标蛋白质U寻找合适的蛋白质模板，这些模板蛋白质与U没有显著的序列相似性，但却是远程同源的。线索化方法一般有5个基本组成部分：（1）已知三维折叠结构的数据库；（2）一种适合于进行序列-结构比对的三维折叠信息的表示方法；（3）一个序列-结构匹配函数，该函数对匹配程度进行打分；（4）建立最优线索的策略，或者是

6、进行序列-结构比对的策略；（5）一种评价序列-结构比对显著性的方法。假设存在有限数目的核心折叠（corefolds）核心折叠实际上是构成蛋白质空间形状的基本模式。建立核心折叠数据库预测----建立线索U序列与数据库核心折叠比对取最佳核心折叠U结构模型一种基于序列与结构比对的最优线索化算法令:s1,s2,…,sn为蛋白质序列S的n个元素C1,C2,…,Cm为数据库中核心折叠C的m个核心区域Cij为第i个核心区域第j个氨基酸位置每一个核心区域由若干个氨基酸残基构成设t是一个从序列到核心折叠的线索，那么t说明了序列S的哪些元素si,sj,sk

7、,…代表核心区域C1,C2,C3,…的起始位置。这实际上是一种从序列S到核心折叠C的比对令代表核心折叠C中的环到序列S中空位的映射，显然是通过线索化而确定的。令f(t)是进行比对的得分函数，其定义如下：f(t)=g1(v,t)+g2(u,v,t)+g3(,t)g1(v,t)评价氨基酸残基v所处的位置g2(u,v,t)评价残基u和v的相对位置，如果u和v键合，则得分高；g3(,t)评价环区，根据环区的大小进行打分。线索化问题：对于给定的序列S和核心折叠C，选择一个线索t，使得f(t)的值最小，即寻找一个从S到C的最佳映射。3、从头

8、预测方法在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下，上述两种蛋白质结构预测的方法都不能用，这时只能采用从头预测方法，即（直接）仅仅根据序列本身来预测其结构。从头预测方法一般由下列3

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 37



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

生物信息学-chapter7_2

生物信息学-chapter7_2

相关文章

相关标签