欢迎来到天天文库
浏览记录
ID:38240483
大小:558.91 KB
页数:4页
时间:2019-05-29
《不等距超球体支持向量机》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、ComputerEngineeringandApplications计算机工程与应用2011,47(11)19不等距超球体支持向量机1,21张慧敏,柴毅1,21ZHANGHuimin,CHAIYi1.重庆大学自动化学院,重庆4000442.重庆电子工程职业学院通信系,重庆4013311.CollegeofAutomation,ChongqingUniversity,Chongqing400044,China2.DepartmentofCommunication,ChongqingCollegeofElectronicEn
2、gineering,Chongqing401331,ChinaZHANGHuimin,CHAIYi.Non-equidistantmarginhypersphereSVM.ComputerEngineeringandApplications,2011,47(11):19-22.Abstract:Fordifferentkindsofsamples,thefollowingcasesareoftenconfronted:Thescopesofsample-distributiondifferlargely,thedegre
3、esofharmformisjudgmentofsampleclassaredifferent,or,thenumbersofdifferentkindsofsamplesarevarious,pointedonwhich,SVM(NMS-SVM)basedonthenon-equidistantmarginhypersphereisproposed.Aimatoptimizingthemaximalmargin,SVMintroducesdistanceratioparameterandadjuststhedistan
4、cebetweentheoptimizedclassingsur-faceandthetwoclasses.ThroughthesimulationexperimentofclassificationofsamplecollectionbyUCIcorpus,thevalidityofSVMisprovedbycomparingtheprecisionofclassificationwiththenormalhyperspherearithmeticaswellasthemaxi-malmarginhypersphere
5、arithmetic.Keywords:SupportVectorMachine(SVM);hypersphere;non-equidistantmargin;maximalmargin摘要:针对现实中经常遇到的各类样本分布范围相差很多、将各类样本误判的危害程度不同、或者各类样本数量差异悬殊等情况,提出了一种基于不等距超球体的SVM(NMS-SVM)算法。该算法以最大间隔为优化目标建立分类模型,同时引入距离比例参数λ,调整最优分类面到两类之间的距离。通过UCI数据库中数据集的分类仿真实验,比较了该算法与普通超球体算法以及
6、最大间隔超球体算法的分类精度,证明了该算法的有效性。关键词:支持向量机;超球体;不等距;最大间隔DOI:10.3778/j.issn.1002-8331.2011.11.006文章编号:1002-8331(2011)11-0019-04文献标识码:A中图分类号:TP181引言而带来比较大的危害。针对这些特殊情况,提出了一种基于传统的支持向量机都是基于超平面的[1],虽然基于超平面不等距的超球体支持向量机(NMS-SVM)算法。最后通过仿的支持向量机在很多领域中都得到了广泛的使用,但也存在真实验证明了该算法的有效性。一定的
7、局限性。Tax和Duin提出了一种基于超球体的支持向量机数据描述(SVDD)[2]。其主要思想是在高维空间计算包含2SVDD算法N样本映射的最小超球体,并权衡超球体半径和它所覆盖的样假设有训练样本:xÎRi=12l,l为样本数。算i本数。在此基础上,文献[3]提出了一种最大间隔最小体积球法要求以a为中心,R为半径的圆可以包含所有的样本点,并形支持向量机算法,它是以最大化R和最小化R为优化目标且要求这个圆尽可能的小[4-6]。类似于超平面算法,超球体算21的,这是个间接过程。本文将采用直接最大化间隔方式来建法为了
8、解决非线性问题,也采用了核函数思想。同时,为了解立优化方程。决数据存在噪声的问题,引入了松弛变量ξ。Vapnik定义的最优分界面都是等距的,这对两类分布相原始的优化问题为:l当的样本效果是好的。但实际中经常遇到的分类数据往往是2minR+Cåξi非平衡样本,少数类别的数据有可能有很大的分类代价,如各i=1T2类样本分
此文档下载收益归作者所有