基于支持向量机的基因选择算法研究

基于支持向量机的基因选择算法研究

ID:33286827

大小:2.44 MB

页数:74页

时间:2019-02-23

基于支持向量机的基因选择算法研究_第1页
基于支持向量机的基因选择算法研究_第2页
基于支持向量机的基因选择算法研究_第3页
基于支持向量机的基因选择算法研究_第4页
基于支持向量机的基因选择算法研究_第5页
资源描述:

《基于支持向量机的基因选择算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、厂——}学校代号:学号:密级:10532S07094049湖南大学硕士学位论文j7‘173£;基于支持向量机的基因选择算法研究—]/7甥燃ResearchesonGeneSelectionAlgorithmwithSupportVectorMachineYOUW.eiB.E.(HuIl锄UIliVerSity)2007A舭sissubmi舵dinpanialSatisfactionof恤Requirementsfor们hedegreeofMasterofEngine谢ngControlSciencea11dEnginee

2、血giIl恤GraduateSchoolHunaIlUIliVersit)rSupeⅣisorProfessorLIShlItaoApril,2010湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:移啤日期:上∥‘口年岁月‘厂日学位论文版权使用授权书本学位论文作者完

3、全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密口,在年解密后适用本授权书。2、不保密团。(请在以上相应方框内打“1J”)作者签名:导师签名诏‘年日期:)夕汐年J,月J7日日期:≥何?o年r月7、日基于支持向量机的慕因选择算法研究摘要随着基因微阵列技术的高速发展,人们可以同时快速地测量成千上万个基因的

4、表达水平。在肿瘤疾病研究中,通过获取基因微阵列数据可以为癌症诊断、治疗、预测提供新的手段。但是,原始的基因微阵列数据具有小样本、高维度特点,直接在此数据中进行分析处理是不现实的。因此,有必要在这些海量的基因数据中,找出对疾病有鉴别作用的基因,提高肿瘤诊断准确性。传统的统计学方法在基因选择中,表现出了较大的局限性。支持向量机(SVM)以统计学习理论为基础,采用结构风险最小化原则,能较好地解决小样本数据学习问题;另外,支持向量机采用核函数技术,能够解决数据非线性可分的问题。因此,在基因选择算法中,支持向量机表现出更强的适应性

5、和优越性。本文基于支持向量机,对基因选择算法进行研究,完成的主要工作如下:1.介绍了基因微阵列数据的制作、特点及应用,分析了支持向量机的原理,并详细研究了SVM.RFE基因选择算法。2.在SVM.RFE算法的基础上,引入了序列前向选择方法。通过以组为单位同时进行特征消去和序列前向选择操作,加快了算法的运行速度,提升了分类性能。3.研究了基于自适应策略选取支持向量机核参数的方法。算法首先利用样本之间的2范数距离设置初始参数值,然后根据进行递归特征消去后重构的样本对核参数进行自动运算更新。4.提出了多SVM混合分类模型。利用

6、不同参数下的多个SVM分别进行基因选择,然后合并各分类器选择出来的基因子集,最后再利用SVM.RFE得到最优的基因子集。算法通过对参数选取一组值代替仅选择一个值,克服了单个参数值选取困难的问题,能够得到更高的分类准确率。在三个公开的基因微阵列数据集上进行了实验,提出的算法能够得到更佳的分类性能。关键词:基因微阵列;基因选择;支持向量机:序列前向选择;核方法II硕士学位论文AbstractWiththequickdevelopmentofgenemicroarraytechnology,researcherscanmeas

7、uretheexpressionofthousandsofgenesdatarapidly.Intheresearchofcancer,thegenemicroarraydatamakeanewwaytodealwithdiseasediagnosis,cancertherapyandcancerprediction.HoweVer,thisoriginalgenemicroarraydatacontainthousandsofgeneswithasmallnumberofsamples,wrhichmakesitdif

8、nculttoanalyzeanddisposethedata.Soitisnecessarytoselectthediscriminategenesubsetfromtheoriginalgenedata,whichcanimproVecancerdiagnosisaccuracy.Thetraditionalst

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。