基于优化算法的蛋白质质谱数据分析

基于优化算法的蛋白质质谱数据分析

ID:32973249

大小:4.29 MB

页数:64页

时间:2019-02-18

基于优化算法的蛋白质质谱数据分析_第1页
基于优化算法的蛋白质质谱数据分析_第2页
基于优化算法的蛋白质质谱数据分析_第3页
基于优化算法的蛋白质质谱数据分析_第4页
基于优化算法的蛋白质质谱数据分析_第5页
资源描述:

《基于优化算法的蛋白质质谱数据分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、山东轻工业学院硕士学位论文基于优化算法的蛋白质质谱数据分析姓名:李义峰申请学位级别:硕士专业:计算机应用技术指导教师:刘毅慧20090609山东轻工业学院硕士学位论文摘要本文研究了基于优化算法的蛋白质质谱数据的特征选择问题。蛋白质质谱技术对于早期癌症的诊断和识别生物标记物是一种革命性的研究工具。但是数据的高维性和小样本问题对于模式识别方法提出了很大的挑战。因此为了解决质谱数据的维灾难问题,在模式分类之前特征选择是必须的降维步骤。特征选择最重要的两个因素是搜索策略和特征评价度量。在生物信号的特征选择领域,单变元特征评价度量已经在文献中

2、提出应用,但是多变元度量却极少使用。本文提出了两个有效的智能优化算法——遗传算法和模拟退火算法来进行特征选择,并且提出了5个多变元特征子集评价函数——包括基于封装器的度量和基于过滤器的度量。k:fold交叉验证用来划分数据成训练样本集和测试样本集。基于线性判别式分析的模式分类器被用来验证特征选择的子集。通过实验表明,马氏距离及经验分类错误率和后验概率的线性组合是2个很好的特征子集评价函数。同其他方法的比较结果证明,本文提出的基于智能优化算法特征选择模型和特征子集评价度量的结合可以获得比其他文献中已提方法更好的性能。在由FDA—NCI

3、临床蛋白组学计划数据库和弗吉尼亚前列腺中心得到的5个权威数据库上的实验表明,这个方法可以得到具有显著的类区分特性的特征子集,这些子集为发现生物标记物和癌症的早期诊断提供了重要的参考。关键词:质谱技术;模拟退火:遗传算法;特征选择;模式分类:早期癌症诊断山东轻工业学院硕士学位论文ABSTRACTThispaperpresentsthemethodsoffeatureselectionforproteinmassspectrometrydatabasedonintelligentoptimization.Proteinmassspect

4、rometryisarevolutionarytechniquetodetectearly—stagecancerandidentifybiomarker.Butthehi曲dimensionalityandsmallsamplesizechallengethepatternrecognitionmethods.Toavoidthecurseofdimensionalityofmassspectra,featureselectionmustbeemployedtoreducethedimensionalitybeforeclassi

5、ficationandanalysis.Themosttwocriticalprescriptionsforfeatureselectionarethesearchstrategyandthefeatureevaluationmeasures.Inthefeatureselectionforbiologicalsignals,univariatefeatureevaluationmeasuresarepresentedinliterature,whilemultivariatemeasuresareseldomused.Inthis

6、study,twoeffectiveintelligentoptimizationmethodsincludingsimulatedannealingandgeneticalgorithmarepresentedforfeatureselection,andfivemultivariatefeaturesubsetevaluationmeasures,includingwrapper-basedmeasuresandmultivariatefilter-basedmeasures,arepresentedandinvestigate

7、d.Moreover,k-foldcross—validationisusedtodividetheoveralldataintotrainingandtestingsubset.Aclassifierbasedonlineardiscriminantanalysisisalsoemployedtovalidatethefeatureselectionmethods.ExperimentsshowthattheMahalanobisdistanceandthelinearcombinationempiricalclassificat

8、ionerrorrateanda-posterioriprobabilityareexcellentfeaturesubsetevaluationmeasures.Thecomparisonresultswiththeothermet

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。