基于样本抽样和权重调整的SWA-Adaboost算法-论文.pdf

基于样本抽样和权重调整的SWA-Adaboost算法-论文.pdf

ID:58140486

大小:306.84 KB

页数:5页

时间:2020-04-24

基于样本抽样和权重调整的SWA-Adaboost算法-论文.pdf_第1页
基于样本抽样和权重调整的SWA-Adaboost算法-论文.pdf_第2页
基于样本抽样和权重调整的SWA-Adaboost算法-论文.pdf_第3页
基于样本抽样和权重调整的SWA-Adaboost算法-论文.pdf_第4页
基于样本抽样和权重调整的SWA-Adaboost算法-论文.pdf_第5页
资源描述:

《基于样本抽样和权重调整的SWA-Adaboost算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第40卷第9期计算机工程2014年9月Vo1.40NO.9ComputerEngineeringSeptember2014·人工智能及识别技术·文章编号:looo-34282014)09-0248-04文献标识码:A中图分类号:TP18基于样本抽样和权重调整的SWA—Adaboost算法高敬阳,赵彦(北京化工大学信息科学与技术学院,北京100029)摘要:根据分类算法是依据样本区分度进行分类的原理,提出增加样本属性以提高样本区分度的方法,在样本预处理阶段对所有样本增加一个属性值d⋯以加强样本之间的区分度。针对原始A

2、daboost算法在抽样阶段由于抽样不均而导致对某些类训练不足的问题,采用均衡抽样方法,保证在抽样阶段所抽取的不同类样本的数量比例不变。针对原始算法样本权重增长过快的问题,给出新的权重调整策略,引入样本错分计数量count(n),有效地抑制样本权重增长速度。给出一种改进的Adaboost算法,即SWA·Adaboost算法,并采用美国加州大学机器学习UCI数据库中6种数据集的数据对改进算法与原始算法进行实验对比,结果证明,改进算法SWA—Adaboost在泛化性能上优于Adaboost算法,泛化误差平均降低9.54

3、%。关键词:样本预处理;均衡抽样;权重调整;泛化性能;类中心最小距离;样本区分度SWA—AdaboostAlgorithmBasedonSamplingandWeightAdjustmentGAOJing—yang,ZHAOYan(CollegeofInformationScienceandTechnology,BeijingUniversityofChemicalTechnology,Beijing100029,China)【Abstract】Becausetheclassificationalgorithmba

4、sedonthedifferencesamongsamples,anewmethodisproposedwhichaddsanewpropertyvalued。intoeachsampleinordertoincreasethedifferences.Besides,accordingtothesituationthatsamplesbelongingtodifferentclassesaresampledunevenlyinthesamplingphase,anewmethodcalledevensampling

5、isproposedtokeeptheproportionofdifferenceclassesinvariant.Forthepurposeofinhibitionoftheincrementspeedofmisclassificationsamples,anewmethodisproposedwhichbringsinavariablecount(n)torecordthetimesofmisclassification.Intheword.animprovedalgorithmcalledSamplingeq

6、uilibrium&Weightadjustment&AddattributeAdaboost(SWA-Adaboost)isproposed.Usingthe6datasetsbelongingtomachinelearningdatabaseofUniversityofCaliforniainUSA,thepaperrunsexperimentstocomparetheoriginalAdaboostwithSWA-Adaboost.ExperimentalresultsshowthatSWA—Adaboost

7、hasbettergeneralizationperformancethantheoriginalAdaboostandtheaveragedecreaseofgeneralizationerroris9.54%.【Keywords】samplepreprocessing;evensampling;weightadjustment;generalizationperformance;minimumdistanceofclasscenter;differentdegreeofsampleDOI:10.3969/j.i

8、ssn.1000.3428.2O14.09.050仍然存在以下缺陷:1概述(1)样本属性部分的区分度不明显而影响样本Adaboost算法作为最受欢迎的分类集成算法分类效果。在机器学习领域得到了极大的关注。。该算法是(2)训练过程中由于对样本抽样不均而使分类boosting算法中应用最广泛的算法,将若干个弱分器对某些类训练不充分。类器通过线性集成而得到一个强分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。