加权最大夹角间隔核心集向量机的不平衡数据分类-论文.pdf

加权最大夹角间隔核心集向量机的不平衡数据分类-论文.pdf

ID:53763663

大小:415.36 KB

页数:7页

时间:2020-04-25

加权最大夹角间隔核心集向量机的不平衡数据分类-论文.pdf_第1页
加权最大夹角间隔核心集向量机的不平衡数据分类-论文.pdf_第2页
加权最大夹角间隔核心集向量机的不平衡数据分类-论文.pdf_第3页
加权最大夹角间隔核心集向量机的不平衡数据分类-论文.pdf_第4页
加权最大夹角间隔核心集向量机的不平衡数据分类-论文.pdf_第5页
资源描述:

《加权最大夹角间隔核心集向量机的不平衡数据分类-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第44卷第3期山东大学学报(工学版)2014年6月Vo1.44NO.3JOURNALOFSHANDONGUNIVERSITY(ENGINEERINGSCIENCE)Jun.2014文章编号:1672-3961f2014)03~001-07DOI:10.6040/j.issn.1672-3961.2.2013.376加权最大夹角间隔核心集向量机的不平衡数据分类鲁淑霞,李黎敏(河北大学数学与计算机学院,河北保定071002)摘要:为了处理大规模数据和不平衡数据分类问题,提出了一种新的分类方法,利用基于最大夹角

2、间隔的核心集向量机算法实现对大样本数据的分类;针对不平衡数据分类问题,通过对不同的样本给予不同的权重,来提高算法的分类性能。加权最大夹角间隔核心集向量机方法不仅能够有效地解决不平衡数据的分类问题,而且能够实现对大样本数据的快速训练。关键词:最大夹角间隔;核心集;核心集向量机;最小包络球;不平衡数据;权重中图分类号:TP391文献标志码:ATheweightedmaximumvectorangularmargincorevectormachineforimbalanceddataclassification

3、LUShuxia,LILimin(CollegeofMathematicsandComputerScience,HebeiUniversity,Baoding071002,Hebei,China)Abstract:Anewclassificationapproachwasproposedinordertodealwithlargesizeandimbalanceddatasetsclassifica—tionproblem.Theproposedmethodwasbasedonthemaximumvect

4、orangularmargincorevectormachinetoimple—mentclassificationforlargedatasets.Fortheimbalanceddatasetsclassificationproblem,eachsamplewasassignedbydifferentweights,whichcouldimprovetheclassificationperformanceofalgorithm.Theproposedapproachcouldeffec—tivelys

5、olvetheimbalanceddatasetsclassificationproblemandimplementfasttrainingonlargedatasets.Keywords:themaximumvectorangularmargin;thecoreset;corevectormachine;theminimumenclosingball;im—balanceddata;weight分类问题剖,如代价敏感学习、主动学习、后验概0引言率支持向量机等。本研究对不平衡数据的处理从学习算法人手,对不

6、同类别的样本给予不同的权重,以在应用领域,经常需要处理数据不平衡问题,例改变算法对不同类别数据的敏感度,使得算法的分如:信用卡欺骗检测,医学诊断,通讯设备故障预测离超平面向样本数多的那类平移,从而提高少数类等。近年,研究者提出了许多处理不平衡数据分类样本的分类精度。的方法:一类从训练集人手,通过改变训练集样本分对于大规模数据,核方法的求解归结为二次规布,降低不平衡程度,如下采样、上采样、智能采化问题,其计算复杂度很高。常见的核方法有:支持样算法;另一类从学习算法人手,根据算法在解决不向量机,支持向量数据描

7、述。,结构核机。,平衡问题时的缺陷,适当修改算法使之适应不平衡小球体大间隔等方法。如何降低求解二次规化收稿日期:2013-06-28网络出版时间:2014-03-2008:58网络出版地址:http://www.cnki.net/kcms/doi/106040/j.issn.1672396122013376.html基金项目:国家自然科学基金资助项目(61170040);河北省自然科学基金资助项目(F2011201063)作者简介:鲁淑霞(1966一),女,河北保定人,教授,博士,主要研究方向为机器学习.

8、E—mail:cmclusx@126.tom2山东大学学报(工学版)第44卷问题的计算复杂度是目前研究的一个热点问题,主‘m⋯ln一一vp+÷l】(【f)一cIl_,要方法有:分块或分解的方法(如SMO算法)¨J,采样法,核密度估计法¨,核心集向量机法(coreS.t.Yic(f)≥p,1≤f≤n。vectormachine,CVM)M等。文献[22—23]指出其对偶形式如下:CVM算法可用于逼近最小包络球(theminimu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。