欢迎来到天天文库
浏览记录
ID:55935479
大小:518.76 KB
页数:9页
时间:2020-06-16
《基于最小最大策略的集成特征选择.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、南京大学学报(自然科学)第50卷第4期Vo1.50,No.4JOURNALOFNANJINGUNIVERSITY2014年7月July,2014(NATURALSCIENCES)DOI:10.13232/j.cnki.jnju.2014.04.010基于最小最大策略的集成特征选择周国静,李云(南京邮电大学计算机学院,南京,210023)摘要:特征选择是机器学习和数据挖掘中的一个关键问题,它可以实现数据维度的约减,从而提高学习模型的泛化能力.近年来,为了提高特征选择算法的性能,集成思想被应用到特征选择算法中,即将多个基特征选择器进行集成.本文从提高特征选择算法对大规模数
2、据处理能力的角度出发,提出了一种基于最小最大策略的集成特征选择方法.它主要包括三个步骤:第一,将原始数据根据类别信息划分成多个相对较小的平衡数据子集;第二,在每一个数据子集上进行特征选择,得到多个特征选择结果;第三,对多个特征选择结果依据最小~最大策略进行集成,得出最终的特征选择结果.通过实验对比了该集成策略与其它三种集成策略对分类准确率的影响,结果表明最小最大集成策略在大部分情况下能够获得较好的性能,且基于最小最大策略的集成特征选择可以有效处理大规模数据.关键词:特征选择,集成,最小最大策略Ensemblefeatureselectionusingrain—maxs
3、trategyZhouGuojing,LiYun(CollegeofComputerScience,NanjingUniversityofPostsandTelecommunications,Nanjing,210023,China)Abstract:Featureselectionisoneofthekeyproblemsinmachinelearninganddatamining.Itinvolvesidentifyingasubsetofthemostusefulfeaturesthatproducescompatibleresultsastheoriginal
4、entiresetoffeatures.hcanreducethedimensionalityoforiginaldata,speedupthelearningprocessandbuildcomprehensiblelearningmodelswithgoodgeneralizationperformance.Nowadays,ensembleideahasbeenfisedtoimprovetheperformanceoffeatureselectionbyintegratingmultiplebasefeatureselectionmodelsintoanens
5、embleone.Itturnedouttobeeffectiveindealingwithhighdimensionalitysmallsamplesizeproblemespeciallyforrobustbiomarkeridentification.Inthispaper,weaimtoimprovetheefficiencyoffeatureselectionindealingwithlargescaleproblems.Inordertodealwithsuchproblems,ensemblefeatureselectionusingrain—maxst
6、rategyisproposed.Themethodconsistsofthreemainsteps:firstly,theoriginaldataisdecomposedintoagroupofrelativelysmallerbalancedonesaccordingtotheirstructureandlabels.Secondly,featureselectionmethodisusedtodealwithallofthesubproblemsandobtaintheresultoffeatureselection,suchasfeatureweight.La
7、stly,thefinalresultisobtainedbycombiningthedifferentresultsofsub—problemsaccordingtothemin-maxstrategy.TheexperimentsaredesignedtocomparetheMin—Maxstrategybasedensemblemethodwiththreeotherstrategies,namely,Mean~Weight·VotingandK—Medoid,ontheaccuracvofclassification.Inthispaper,
此文档下载收益归作者所有