基于v-间隔超球体支持向量机的非平衡数据分

基于v-间隔超球体支持向量机的非平衡数据分

ID:38211303

大小:387.67 KB

页数:6页

时间:2019-05-27

基于v-间隔超球体支持向量机的非平衡数据分_第1页
基于v-间隔超球体支持向量机的非平衡数据分_第2页
基于v-间隔超球体支持向量机的非平衡数据分_第3页
基于v-间隔超球体支持向量机的非平衡数据分_第4页
基于v-间隔超球体支持向量机的非平衡数据分_第5页
资源描述:

《基于v-间隔超球体支持向量机的非平衡数据分》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第26卷第12期重庆理工大学学报(自然科学)2012年12月Vol.26No.12JournalofChongqingUniversityofTechnology(NaturalScience)Dec.2012doi:10.3969/j.issn.1674-8425(z).2012.12.019基于ν-最大间隔超球体支持向量机的非平衡数据分类李秋林(西南大学数学与统计学院,重庆400715)摘要:针对传统超球体支持向量机在处理非平衡数据集时出现的少数类查全率较低的问题,通过引入最大间隔和参数ν

2、,提出了ν-最大间隔超球体支持向量机。该算法以最大间隔为优化目标建立分类模型,大幅度提高了少数类查全率。通过UCI数据集的分类仿真实验,比较了该算法与传统超球体支持向量机的分类精度。结果表明,该算法能有效提高对非均衡分布数据的分类准确率。关键词:支持向量机;超球体支持向量机;最大间隔;非均衡数据中图分类号:TP18文献标识码:A文章编号:1674-8425(2012)12-0093-06ClassificationofImbalancedDataBasedonNumaximumMarginHyperSphereSupportVectorMachineLIQiulin(School

3、ofMathematicsandStatistics,SouthwestUniversity,Chongqing400715,China)Abstract:InviewofthetraditionalHSSVM(hyperspheresupportvectormachine)inprocessingofimbalanceddatasettheminorityclasstheproblemoflowrecallratio,andbyintroducingthemaximummarginandtheparameternu,thispaperproposedtheNUMMHSSVM(n

4、umaximummarginhyperspheresupportvectormachine).Thealgorithmtakesthemaximummarginastheoptimizationtargettobuildaclassificationmodel,greatlyimprovingtheminorityclassrecall.ThroughUCIdatasetclassificationexperiments,thealgorithmwiththetraditionalHSSVM(hyperspheresupportvectormachine)classifica

5、tionaccuracyiscompared.Theresultsshowthatthealgorithmcaneffectivelyimprovetheimbalanceddistributionofdataclassificationaccuracy.Keywords:supportvectormachine;hyperspheresupportvectormachine;maximummargin;imbalanceddata收稿日期:2012-08-22作者简介:李秋林(1987—),男,硕士研究生,主要从事支持向量机、机器学习研究。94重庆理工大学学报

6、[1]l经典的支持向量机(SVM)通过构造最优超2minR+C∑ξiR平面来分隔两类样本,由于其简单和良好的泛化i=122(1)能力使得其在众多领域得到广泛应用[2-8]。Taxs.t.‖Φ(xi)-a‖≤R+ξi和Duin[9-10]受支持向量机的启发,提出了超球体ξi≥0,i=1,…,l支持向量机(HSSVM),用于支持向量数据描述分原始问题(1)的对偶问题为:lll类,其主要思想是建立包含样本的最小超球体。min∑∑αiαjK(xi,xj)-∑αiK(xi,xi)αi=1j=1i=1HSSVM已广泛应用于人

7、脸识别、预警技术、故障l(2)检测等方面。在此基础上,有学者相继提出了最s.t.∑αi=1i=1[11]大间隔最小体积球形支持向量机、不等距超球0≤αi≤C,i=1,…,l[12]体支持向量机、最大边界模糊核超球分类方其中K(xi,xj)=(Φ(xi),Φ(xj))。通过求解对偶[13]法等。问题(2),最终可以得到判决函数为非平衡数据集是指数据集中某些类的样本数llf(x)=sgnR2量比其他类的样本数量大很多,其中样本少的类(-∑∑αiαjK(xi,x

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。