欢迎来到天天文库
浏览记录
ID:36791073
大小:6.16 MB
页数:50页
时间:2019-05-15
《蛋白质相互作用界面中热点残基预测方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、武汉科技大学硕士学位论文第1页摘要绝大部分的蛋白质相互作用结合自由能仅由少数关键残基所贡献,这种残基被称为热点残基。热点残基对我们理解蛋白质功能和研究蛋白质相互作用非常重要。目前主要通过丙氨酸突变扫描技术来鉴别热点残基,但因为代价高、周期长等因素而不能大规模应用,因此急需可靠的、高效率的计算方法来构建热点残基预测模型。本文使用基于蛋白质特征属性的方法,结合支持向量机(SVM)分类算法,构建了一个混合SVM模型来预测蛋白质相互作用界面中的热点残基。首先在ASEdb数据库中提取出实验所需要的训练样本集,然后提取了与蛋白质相关的60个属性特征,包括理化属
2、性、结构属性以及其它相关属性,并将这60个属性分为5个类别,对5个类别分别进行特征选择,得到5个特征子集分别构建SVM预测模型。通过对这5个预测模型的评价,得出了两个能有效预测出热点残基的模型,然后结合这两个预测模型构建出混合SVM模型,为了进一步进行验证模型的可靠性,我们还在BID数据库中提取出独立的测试样本集来验证我们的预测模型。我们还将前人研究的预测模型和我们的预测模型进行了对比,包括RobeRa模型、FOLDEF模型、KFC模型和MINERVA模型,这些模型在热点残基预测领域有着非常重要的意义。使用相同的训练样本集来构建预测模型,并使用相同
3、的测试集来验证,我们的模型在热点残基的预测能力上有明显的提高,证明了我们方法的适用性。关键词:蛋白质相互作用;热点残基;支持向量机;特征选择;混合SVM模型AbstractThemostofthebindingfleeenergyofproteininteractioniscon砸butedbVafewkev—residues,whichwerecalledhotspots.Hotspotsarecrucialforunderstandingthefunctionofproteinsandstudyingtheirinteractions.Them
4、ostpopularmethodofdetectinghotspotsisalaninescanningmutagenesisexperimental,butthismethodisnotapplicableonalargescalesinceitIStimeconsumingandexpensive.Therefore,reliableandefficientcomputationalmethodsforidentifyinghotspotsaregreatlydesiredandurgentlyrequired.Inthisthesis,wei
5、ntroduceahybridSVMmodelwhichbasedonfeaturesofproteinandthealgorithmofsupportvectormachine,thatcanpredicthotspotsinproteininterfaceefficiently.Firstly,weobtainthetrainingsetfromthealaninescanningenergeticdatabase(ASEdblforexperiment,andthenweextract60proteininteractionfeatures,
6、containingPhyrsicochemicalfeatures,structurefeaturesandotherrelativefeatures.Wedividethe60featuresintofiveclasses.usingfeatureselectionrespectivelytoobtainfivesubsetfeaturesandthenbuildfiveSVMmodels.Byevaluatingthesefivepredictionmodels,wefindtwoofthemMilchcanpredicthot.spotse
7、ffectively.WebuildahybridSVMmodelbycombiningwiththetwoSVMmodelswhichcanfurtherpromotethepredictionperformance.InordertofurthervalidateourhybridSVM’model,weextractindependenttestsetfromthebindinginterfacedatabasefBID)toevaluateourmodelWecompareourpredictionmodelwithpreviousones
8、,includingRobettamodel,FOLDEFmodel,KFCmodelandMINERVAmodel,th
此文档下载收益归作者所有