欢迎来到天天文库
浏览记录
ID:32974821
大小:2.67 MB
页数:68页
时间:2019-02-18
《基于稀疏表示的蛋白质质谱数据分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、杭州电子科技大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:粝钆盍日期:&D,2年j月卅日学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或使用
2、论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)论文作者签名:指导教师签名:砂齑(叫日期:山订文年岁月叫日日期:uf戽;月。,日杭州电子科技大学硕士学位论文基于稀疏表示的蛋白质质谱数据分析研究生:柯激情指导教师:厉力华教授祝磊副教授DissertationSubmittedtoHangzhouDianziUniversityfortheDegreeofMasterSparseRepresentationBas
3、edProteinMassSpectrometryDataAnalysisCandidate:KeJiqingSupervisor:Prof.LiLihua,AssociationProf.LeiZhuDecember,2011I杭州电子科技大学硕士学位论文摘要蛋白质质谱技术是一种蛋白组学研究有力的工具,在癌症的早期诊断和生物标志物(Biomarker)寻找中有着巨大的应用潜力。从模式识别的角度来看,癌症诊断和生物标志物寻找分别对应了模式识别中最经典的模式分类与特征选择问题。由于质谱数据本身具有高维度、小样本的特点,使得针对这些数据的分析与处理工作给传统的模式识别
4、方法带来了巨大的挑战,因而特征选择成了必不可少的步骤。通常的模式识别分类方法强烈依赖于降维与训练两个步骤。但是存在几个突出的问题:首先,一个复杂的降维步骤也许在某一个数据集上表现良好,却很难直接应用于其他的数据集上。其次,一些特征提取方法(如PCA)仅仅为服务于分类判别任务,往往在转换而成的新特征空间里,数据仅被看成数值表达,而不再具有明确的物理意义。显然的,这些转换是不符合生物标志物挑选需求的。最后,训练完毕后的分类器退化成一个毫无“生气”的黑箱,不再具有对新数据的直接在线学习能力。针对上述的癌症诊断类型问题,本文在质谱数据分析中引入了稀疏表示分类方法。使用高斯
5、分布的随机投影的方法简单的绕开特征提取过程:使用样本扩充的方法改善小样本问题中稀疏表示的欠稀疏情况,在改善实验结果的同时又印证了本文稀疏表示分类方法良好抗鲁棒性能力。另外,稀疏表示分类方法是一种在线型学习算法,能根据实际样本不断自我调节,从而不断“进化’’,是一种智能化学习算法。在论证了稀疏表示分类能力的基础上,针对上述的生物标志物选择问题,本文结合稀疏表示分类与“缠绕法"特征选择模型,得到生物标志物候选集,在此基础上再进一步精选,得到了极少数却又对分类鉴别有突出贡献的生物标志物。通过公共数据集以及来自临床的数据集的实验结果表明,稀疏表示分类有着良好的分类性能以及
6、抗鲁棒性能力,可以应用在蛋白质质谱数据的分类问题。本文的特征选择算法能够挑选出少量的几个具有较高性能,且具有生物意义的蛋白位点。关键词:蛋白质质谱,稀疏表示,癌症诊断,特征提取,蛋白位点杭州电子科技大学硕士学位论文ABSTRACTProteinmassspectrometryisapowerfultoolinproteomicsresearch.Itspotentialforseekingproteomicbiomarkersandearlydiagnosisofcancerhasreceivedagreatdealofattentioninrecentyears
7、.Fromthestandpointofpatternrecognition,thecancerdiagnosisandthesearchofbiomarkersarecorrespondingtothemostclassicalpatternclassificationandfeaturesselectionproblemrespectively.Sufferingfromthetraitsofhighdimensionality,andsmallsampleinmassspectrometrydata,thetraditionalclassificationm
8、ethod
此文档下载收益归作者所有