基于Relief特征选择算法的研究与应用

基于Relief特征选择算法的研究与应用

ID:36570092

大小:3.85 MB

页数:52页

时间:2019-05-12

基于Relief特征选择算法的研究与应用_第1页
基于Relief特征选择算法的研究与应用_第2页
基于Relief特征选择算法的研究与应用_第3页
基于Relief特征选择算法的研究与应用_第4页
基于Relief特征选择算法的研究与应用_第5页
资源描述:

《基于Relief特征选择算法的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于Relief特征选择算法的研究与应用TheStudyandApplicationofFeatureSelectionAlgorithmsBasedonRelief学号:21009239完成日期:2013年5月大连理工大学DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途

2、使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:基主豳鲜鱼蝌蕴煦聋亟墨重愚——作者签名:蕉嗑盗.日期:垫璺年—上月—L日大连理工大学硕士学位论文摘要伴随着当代科学技术的高速发展,人类已经进入了信息爆炸的时代。数据挖掘技术通过从大量数据中揭示出隐含的信息,将海量的高维数据转换为有用的信息和知识。特征选择是数据挖掘中的一个重要方向,特征选择算法通过剔除不相关或冗余的特征,从而达到减少特征个数,提高模型精度,减少运行时间的目的。从数

3、据解释的层面上看,关键特征的提取还可以使模型得到简化,从而便于研究人员理解数据的产生。Relief是一种有效的特征选择算法。与ReliefF不同,Multi.Relief通过在多次随机抽取的两类样本上运行Relief算法将其由2类问题推广到多类问题。由于一次抽样只能随机抽取多类数据中的两类样本,可能造成所选样本的分布不具有代表性。为了有效融和每次抽样的结果,准确度量属性的的权重,本文提出了一种改进的Multi.Relief算法,该算法对每一次抽样产生的权重向量分组,将在组内出现频率小于一定程度的正权值摒弃,形成新的权重融

4、合方法。在三组肝病代谢组学数据和三组公共数据中的实验表明,改进的Multi—Relief算法与Multi—Relief和ReliefF算法相比,性能得到了提高。本文还将ReliefF.RYE算法应用于生物数据的处理中。本文经过对基于SVM的RelietF—RFE原理的分析以及研究,在本实验中用kNN分类器取代了SVM分类器。在两组肝病代谢组学数据以及六组高维的生物公共数据上的实验结果显示ReliefF.RFE算法与经典的ReliefF算法对比,所筛选的属性区分能力更强。本文从两个不同的角度对Relief族特征选择算法进行

5、了讨论和分析,并通过十次十倍交叉验证分类准确率结果证明了两种算法的有效性。关键词:特征选择;Relief;迭代特征删除基于Relief特征选择算法的研究与应用TheStudyandApplicationofFeatureSelectionAlgorithmsBasedonReliefAbstractAlongwiththerapiddevelopmentofcontemporaryscienceandtechnology。mankindenteredtheeraofinformationexplosion.Datamin

6、ingtechnologyrevealstheimpliedinformationinthedata.andtransformsthemagnanimityhigh-dimensionaldataintousefulinformationandknowledge.Featureselectionisallimportantdirectionofdatamining.’IⅧefeatureselectionalgofithmreducethenumberoffeaturesbyremovedtheirrelevantfea

7、turesandredundantfeatures,andachievetheaimofimprovementofmodelaccuracy,anditCanalsoreducetherunningtimeofthealgorithm.Ontheotherhand,byselectingouttherelevancefeatures,themodelcarlbesimplifiedandthemaketheresearcherseasilyunderstandtheprocessofdatageneration.Reli

8、efiSaneffectivefeatureselectionalgorithm.DifferswiththeRelieffalgorithm,Multi-ReliefrunsReliefalgorithmontwo-classsampleswhicharegotbythemultipletimesofrandoms

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。