资源描述:
《基于数学模型的蛋白质超二级结构β—α—β模体预测》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于数学模型的蛋白质超二级结构B-a—B模体预测引言在蛋白质结构中,2个平行的B-strand被较长的loop连接,loop中间包含a螺旋(a-helical),并且2个B折叠片之间存在氢键,形成的结构模体B-loop-a-loop-B叫做B-a-B模体,它是含有平行的B折叠(sheet)的蛋白质中的常见模体[1,5]o因此,对3-a-p模体的统计分析及预测是十分有意义的。在本文中,对1423条相似性小于33%的蛋白质链中包含的B-a-B模体和非B-a-B模体作为训练集,5交叉检验预测总精度和相关系数分别是75.51和0.49。将此模型应用于另外1个独立检验集进行检验预测精度达到72.23
2、%O1材料和方法1.1材料数据库选取了EVA的1423个相似性小于33%的蛋白质作为训练集[4],同时选取了426个非冗余的蛋白质链组成,作为独立检验集。文中对训练集,获得二级结构为ECHCE模式的片断为3878个,利用PROMOTIFE3]获得B—a—B模体分别为1622个,与ECHCE模式相匹配的1459个片断确认为B-a-B,其余2419个确认为非B-a-B;对独立检验集,有257条蛋白质链中至少包含一个B-a-B模体,这个数据库中共得到310个B-a-B模体和480个非B-a-B模体。1.2最佳序列片段长度的选取由于二级结构是形成蛋白质超二级结构的基础单元,而超二级结构的构象类型与
3、连接肽所连接的二级结构单元的种类、连接肽的长度以及连接肽残基的构象密切相关,所以有必要对序列对应的每一种二级结构进行详细的统计和分析,过程如下:由于Loop-a-Loop结构中含有6〜29个氨基酸的序列数占83.6%,为保证大部分序列被选入,且所选取的序列两端B折叠至少含有2个氨基酸残基,序列总长确定为33个氨基酸残基。确定B-a-B模体的固定长时采取以Loop-a-Loop为中央标准位置对齐,选取时需满足:当序列总长大于33时,只保留Loop-a-Loop长小于等于29的序列。选取方式参考了Kuhn[2]>Kumar[4]和Cruz[3]等的对B发夹固定模式片段截取方法。2结果与讨论训练
4、集5交叉检验的预测结果2.1QD方法的预测结果为了进一步提高预测性能,组合上述计算的PCSF和DM值作为QD的输入参数,得到了较好的预测结果见表loMcc的值上升为0.49,总精度也提高到了75.51%,预测效果得到了改善。2・2独立检验集中B-a-B模体预测结果为了检验预测方法,对独立检验集中的B-Q-B和非B-a-B模体使用同样的方法进行预测。对独立检验集分别使用PCSF、DM和QD方法的预测结果见表2。由表2的预测结果可以看出,独立检验集使用QD方法的预测结果好于PCSF和DM方法,独立检验集中的Mcc值0.43,预测总精度72.23%O3结论本文使用的数据库包含的蛋白质结构类型有全
5、B型、a+B型和a/3型,选择的数据库远远大于Taylor和Thornton在1983和1984年对B/a类的18个蛋白质中的62个3-a-p模体进行预测的数据库[5-6],而且本文进一步运用了距离函数,以组合向量为参数进行预测,预测效果得到了明显的改善。成功的预测指出:应用的参数包含了模体的序列信息和结构信息;距离函数的引入,更反映出了数学模型应用于蛋白质超二级结构是成功的;用打分函数和距离函数值来表示位点氨基酸组分信息,保证了序列片段的保守性。因此基于数学模型的组合向量的二次判别方法是一种预测酶蛋白质中复杂超二级结构的有效方法。参考文献[1]阎隆飞,孙之荣•蛋白质分子结构[D]•清华大
6、学出版社,1999:43-59.[1]Kuhn,M,Meiler,J・andBaker,D・Strand-loop-strandmotifs:predictionofhairpinsanddivergingturnsinproteins[J]・Proteins:StructFunctBioinform,2004(54):282-288.[2]Cruz,X,Hutchinson,E・G,Hepherd,A.S・etal.Towardpredictingproteintopology:anapproachtoidentifyingBhairpins[J].ProcNatlAcadSci,USA
7、,2002(99):11157-11162.[3]Kumar,M,Bhasin,M・BhairPred:predictionofB-hairpinsinaproteinfrommultiplealignmentinformationusingANNandSVMtechniques[J].NuclAcidsRes,2005(33):154-159.[4]Taylor,W・R,Thornton,J・M,Recognition