欢迎来到天天文库
浏览记录
ID:33157731
大小:2.29 MB
页数:60页
时间:2019-02-21
《一种基于小波变换特征提取的集成学习算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、河南大学硕士学位论文一种基于小波变换特征提取的集成学习算法姓名:丁爽申请学位级别:硕士专业:计算机应用技术指导教师:申石磊;范明20100501河南大学研究生硕士学位论文摘要国际权威T.GDiettedch将集成学习列为机器学习四大研究方向之首。泛化能力是评价机器学习算法好坏的重要指标。集成学习通过某种策略组合分类算法,能够有效地提高算法的泛化能力。创建泛化能力强、差异大的基分类器是集成学习算法成功的关键。小波变换作为一种有效的特征提取方法,因其在时域和频域都具有良好的局部特性,近年来受到学者们的密切关注。设计出具有高
2、泛化能力的集成学习算法,一直是集成学习研究的热点问题之一。论文在分析和学习经典集成算法的基础上,提出一种基于小波变换特征提取的集成学习算法,即Wavelet-Forests算法。该算法的主要思想是通过构造具有差异性的基分类器,提高集成学习算法的泛化能力。在构造基分类器时,Wavelet.Forests算法采用处理训练数据集和处理输入特征相结合的方法,将特征集随机划分为多个特征子集,根据每个划分的特征子集,选择一个非空类子集对应的数据子集,再对这些数据子集采用自助法生成新的数据子集。在新的数据子集上实施小波变换,得到每个
3、数据子集对应的小波系数矩阵。整合小波系数矩阵,得到基分类器的训练数据集。在集成基分类器时,采用平均法计算每个类的权,返回具有最大权的类。为了验证Wavelet-Forests算法的可行性和有效性,论文使用数据挖掘领域公认的WEKA平台实现该算法。采用UcI数据库提供的标准数据集,将Wavelet-Forests算法与单个分类器J48,以及Bagging、AdaBoost和RandomForest等经典集成算法的性能进行比较,使用准确率和ROC曲线分析实验结果。实验结果表明,Wavelet.Forests集成学习算法具有
4、较高的准确率,可以用来处理不平衡类问题。关键词:集成学习;小波变换;特征提取;泛化能力;ROC曲线第Ⅱ页河南大学硕士研究生学位论文ABSTRACTEnsembleleamingisthefirstofthefourmajorresearchesinmachinelearningbvZGDiettefich。Generalizationabilityistheprincipleissueinthefieldofmachinelearning.Ensemblelearningisalearningparadigm,whic
5、hcallimprovethegeneralizationabilityofthealgorithmbycombiningclassificationalgorithmthroughastrategy.Goodgeneralizationabilityofbaseclassifieranddiversitybetweenthebaseclassifiersisthekeytosuccessfulensemblelearning.W-avelettransfonilasalleffectivefeatureextract
6、ionmethodgetmoreandmoreattentionbyresearchersinrecentyears,becauseofitsgoodlocalpropertiesinthetimedomainandfrequencydomain.Howtodesignanensemblelearningalgorithm晰廿1goodgeneralizationabilityhasbeenahottopicofensemblelearningresearch.Basedondepthanalysisandstudyc
7、lassicalensemblelearningalgorithm,thispaperpresentsanensemblelearningalgorithmbasedonthefeatureextractionbywavelettransfotin,whichiscalled肠yelet.Forests。刃够mainideaofthisalgorithmistoimprovethegeneralizationabilityoftheensembleleamingalgorithmbythediversitybetwee
8、nthebaseclassifiers.Intheprocessofbaseclassifierconstruction,Wavelet—Forestsadaptscombiningdifferentsubsetsoftrainingdataanddifferentfeaturesubset.Tocreatethetraining
此文档下载收益归作者所有