欢迎来到天天文库
浏览记录
ID:34308554
大小:1.33 MB
页数:43页
时间:2019-03-04
《基于互信息的信息基因选择算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代号10530学号201510111110分类号O241.82密级硕士学位论文基于互信息的信息基因选择算法研究学位申请人郭园园指导教师喻祖国教授学院名称数学与计算科学学院学科专业数学研究方向生物与环境信息处理二〇一八年四月十日基于互信息的信息基因选择算法研究学位申请人郭园园导师姓名及职称喻祖国教授学院名称数学与计算科学学院学科专业数学研究方向生物与环境信息处理学位申请级别理学硕士学位授予单位湘潭大学论文提交日期2018-4-10Researchoninformationgeneselectionalgorithmbased
2、onmutualinformationCandidateYuanyuanGuoSupervisorandRankProfessorZu-GuoYuCollegeSchoolofMathematicsandComputationalScienceProgramMathematicsSpecializationBiologicalandEnvironmentalInformationProcessingDegreeMasterofScienceUniversityXiangtanUniversityDateApril10th,20
3、18湘潭大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果.除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品.对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明.本人完全意识到本声明的法律后果由本人承担.作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅.本人授权湘潭大学可以将本学位论文的全部或部分内容
4、编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文.涉密论文按学校规定处理.作者签名:日期:年月日导师签名:日期:年月日摘要互信息是信息论中的重要概念,被用来度量两个随机变量之间的相关性。在信息基因选择中,以互信息理论为基础的最大信息系数(MIC)与最大相关最小冗余(mRMR)是特征选择中最具代表性的两种方法。针对肿瘤基因表达谱数据的小样本、高维数、高噪音特点,选择一种合适的算法来进行信息基因的选择尤为重要,MIC虽具有普适性与等价性的优点,但其在信息基因选择中仅能对特征与类别进行相关性度量,不能有
5、效去除特征间的冗余特征;mRMR虽能有效去除冗余特征,但对数据规模有一定的局限性。因此,本文提出改进mRMR的新算法――mRMR-ChiMIC算法,将原mRMR算法中度量相关性的互信息使用归一化后的互信息(MIC)来代替,并使用ChiMIC算法来近似估计MIC值。通过DLBCL、Prostate、Lung三个公用数据集进行实验验证,结果表明,本文提出的mRMR-ChiMIC算法较原mRMR算法提取的特征具有更高的分类准确率,且有效降低了计算复杂度。关键词:互信息;最大信息系数;最大相关最小冗余;基因表达谱;特征选择IAbstr
6、actMutualinformationisanimportantconceptininformationtheory,whichisusedtomeasurethecorrelationbetweentworandomvariables.TheMaxi-mumInformationCoecient(MIC)andtheMaximumRelevance&MinimumRedundancy(mRMR)basedonthemutualinformationtheoryarethetwomostrepresentativemeth
7、odsinfeatureselection.Inviewofthecharacteristicsofsmallsample,highdimensionandhighnoiseoftumorgeneexpressionproledata,itisveryimportanttoselectasuitablealgorithmtoselecttheinformationgene.AlthoughMIChastheadvantagesofgeneralityandequitability,itcanonlymea-suretheco
8、rrelationbetweenfeatureandcategoryintheselectionofinformationgene,andcannoteectivelyremovetheredundancybetweenfeatures.AlthoughthemRMRcan
此文档下载收益归作者所有