欢迎来到天天文库
浏览记录
ID:23622243
大小:5.67 MB
页数:88页
时间:2018-11-09
《蛋白质序列并行分类方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中文摘要本论文的主要研究对象是生物信息学中的蛋白质序列分类问题。利用计算的方法,从蛋白质的一级序列决定了其三维结构的角度出发,针对氨基酸序列建立数学模型进行蛋白质结构分类,并引入并行计算的思想提高分类器性能。用并行计算方法进行蛋白质序列的结构分类减少了昂贵且非常耗时的实验次数,提高了分类效率,促进了对复杂的生物规律的分析和对有用生物信息的提取。本文在当前准确性最高的基于判别模型的蛋白质远同源检测算法的基础上,结合基于统计剖面的生成模型方法,设计了基于统计剖面的核函数。并通过半监督学习的方法提高了远同源检测算法的准确性。针对蛋白质序列分类中正样本数远小于负
2、样本数,造成支持向量机训练不平衡的问题,本文提出了优化支持向量机算法,对正类样本集和负类样本集应用不同的惩罚参数,平衡了正负样本。对给定测试集进行的预测实验结果表明本文的算法取得了优于其它远同源检测算法的预测效果。针对标准支持向量机算法只能分别对每一个蛋白质结构类进行二元判别的问题,本文引入了多类支持向量机对标准二元SVM分类器的判别结果进行综合,输出唯一的蛋白质结构类预测结果,提高了基于支持向量机的蛋白质序列分类的可用性。多类支持向量机需要复杂的计算完成支持向量机训练,可以说是用大量计算为代价提升算法的准确性。为降低算法的时间复杂性,本文引入并行计算思
3、想,设计了基于主从模型的蛋白质并行多类分类算法,在基于共享内存和基于消息传递的并行模式下都取得了很好的加速效果。所有基于支持向量机的算法都需要一定数量的样本进行训练建模,由于样本数不足造成支持向量机算法仅能覆盖部分蛋白质结构类。本文通过将高准确率的支持向量机算法与全覆盖的双序列比对算法结合,构成组合分类器进行蛋白质序列分类。在基准数据集上的实验表明,组合分类器不仅实现了对数据集的全覆盖而且综合性能也优于单独的任何一种预测算法。为提高组合分类效率,本文设计了基于两级任务池模型的蛋白质并行多类分类算法,有效降低了通讯等待时间,提升了并行的性能。关键词:蛋白质
4、序列分类支持向量机组合分类器并行计算ABSTRACTInthispaper'themainresearchobjectistheproteinsequenceclassificationprobleminbioinformatics.Weusethemethodofcalculation,fromtheviewpointoftheprotein’Saminoacidsequencesdeterminedthethree—dimensionalstructure,toestablishmathematicalmodelandconstructanappro
5、priateoptimizationalgorithmtosolvetheproteinsequenceclassificationproblem.Usingthemethodofcalculatinginproteinsequenceclassificationcouldreducethenumberofexperimentwhichisverytime-consumingandexpensive,andpromotetheanalysisofthecomplexbiologicallawsandtheextractionofusefulbiologi
6、calinformation.Ourworkisbasedontheproteinremotehomologousdetectionalgorithmusingdiscriminativemodelwhichhasthehighestaccuracyinthecurrentmethodsandcombinedwiththegenerationmodelbasedonstatisticalprofilesbydesigningthestatisticalprofilekernelfunction.WeUsethesemi-supervisedlearnin
7、gmethodtoimprovetheaccuracyoftheremotehomologydetectionalgorithm.Inproteinsequenceclassificationproblem,thenumberofpositivesamplesisfarlessthanthenegativesamples.Theseresultedinanimbalancetrainingproblemsofsupportvectormachine.Thispaperimprovedsupportvectormachinealgorithmbyapply
8、adifferentpenaltyparametersonthepositive
此文档下载收益归作者所有