欢迎来到天天文库
浏览记录
ID:38157468
大小:343.96 KB
页数:5页
时间:2019-05-31
《一种基于粗糙集理论的支持向量机分类算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第3期Vol.7No.32012年6月JournalofCAEITJun.2012殝檵檵檵檵檵檵檵檵檵檵檵檵檵殝檵檵“高效能计算”专题檵檵殝檵檵檵檵檵檵檵檵檵檵檵檵檵殝一种基于粗糙集理论的支持向量机分类算法11,21张立民,刘峰,刘凯(1.海军航空工程学院电子信息工程系,山东烟台264001;2.解放军92785部队,河北秦皇岛066200)摘要:粗糙集理论和支持向量机在数据挖掘方面具有较强的互补特性,基于粗糙集理论的上近似集、下近似集和边界域概念,结合支持向量机的分类原理,提出了一种支持向量机分类算法。首先,在支持向量机分类中定义样本分类的粗糙集规则,然后在边界域寻找两
2、类样本中使判别式绝对值取值最小且分类正确的样本来确定最优分类面,脱离了对惩罚系数C的寻优问题,有效避免了过拟合问题,并通过循环迭代算法寻找合适的参数b,获得分类性能更优的支持向量机,最后通过对一个二维样本数据库进行分类实验,验证了此算法的有效性与可行性。关键词:支持向量机;粗糙集;分类;惩罚系数中图分类号:TP181文献标识码:A文章编号:1673-5692(2012)03-0241-05ASupportVectorMachineClassificationAlgorithmBasedonRoughSetsTheory11,21ZHANGLi-min,LIUFeng,LI
3、UKai(1.DepartmentofElectronicInformationEngineeringofNAEI,ShandongYantai264001,China;2.Unit92785ofPLA,HebeiQinhuangdao066200,China)Abstract:Roughsetstheory(RST)andsupportvectormachine(SVM)hasstrongcomplementarychar-acteristicsintermsofdatamining.Aclassificationalgorithmbasedonlowerapproxi
4、mationset,upperapproximationsetandtheboundaryregioninRSTandclassificationprincipleinSVMhasbeenpresen-ted.RoughsetsrulesofsampleclassificationbasedonSVMclassificationaredefined.Thenthesampleinthemarginregionwhichmakestheabsolutevalueofthediscriminantminimizationissearchedandthecorrectclass
5、ificationtoobtaintheoptimalseparatingsurfacehasbeengotten.Itgetsoutoftheoptimiza-tionproblemofthepenaltycoefficientC,avoidstheover-fittingproblem,andsearchesthemostoptimalcoefficientbbycycliciterativemethodtoobtainabetterSVM.Finally,aclassificationexperimentonatwo-dimensionalsampledatabas
6、eprovesthevalidityandfeasibilityofthisalgorithm.Keywords:SupportVectorMachine(SVM);RoughSets;Classification;PenaltyCoefficient持向量机分类算法以来,由于其在数据分类中表现0引言出的优越性受到了广泛的重视和应用,特别是在小样本、高维和非线性数据空间下,根据有限的样本信数据分类是数据挖掘理论中最重要的方面之息在模型的复杂性和学习能力之间寻求最佳折[1,2]一,自Vapnik等人在统计学习理论的基础上提出支衷,与传统的学习方法相比具有较好的学习性收稿日期
7、:2012-04-28修订日期:2012-05-16基金项目:国家自然科学基金(61102165)2422012年第3期能和泛化能力。但是由于数据库中存在噪声等不确划问题:定性样本,使得支持向量机很难达到令人满意的分1minΦ(w)=(w·w)类精度。{2粗糙集理论是一种处理不精确、不一致、不完整s.t.yi[(w·xi)+b]≥1,i=1,2,…,l等信息的数据分析理论[3],广泛地应用于数据分类但是在实际应用时,大多数情况下并不能满足等实际情况,能够有效处理噪声等不确定性样本,因线性可分性,即使问题是线性可分的,由于各种原
此文档下载收益归作者所有