欢迎来到天天文库
浏览记录
ID:5338685
大小:386.37 KB
页数:4页
时间:2017-12-08
《一种svm训练样本集寻优算法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第27卷第9期计算机应用与软件Vo1.27No.92010年9月ComputerApplicationsandSoftwareSep.2010一种SVM训练样本集寻优算法吴东洋业巧林业宁张训华武波(南京林业大学信息技术学院江苏南京210037)摘要首先运用Bagging算法解决样本数据变化带来的不稳定性,然后运用网格搜索法寻找合适的训练样本尺寸,再结合两者的特点,提出了一种自助网格搜索算法,从多个支持向量机(SVM)分类器中寻求一个最优的SVM分类器。实验结果表明,算法有效地提高了分类器的学习精度与学习性能,对大样本数据来说
2、,可以用相对较少的样本进行训练后的性能来预测它对一个非常庞大的训练集的性能,大大减少了SVM训练的时间。关键词SVM分类器Bagging算法自助网格搜索算法训练样本数量ASEARCHALGoⅪTHMFoRSVMTRAININGSAMPLEDATASETWuDongyangYeQiaolinYeNingZhangXunhuaWuBe(SchoolofInformationTechnology,NanjingForestryUniversity,Nanjing210037,Jiangsu,China)AbstractGenera
3、llyspeaking,thetrainingsample’Salterationwillcausetheclassifiertochange.Selectingappropriatetrainingsamplesisespeciallysignificanttoconstructingtheclassifierwithsuperiorperformances.Inpracticaltrainingoftheclassifier,thealterationsofthesampledataandsamplesizearetol
4、eadthevariationoftheSVMclassifier.Inthispaper,thebaggingalgorithmisusedfirsttosolvetheinstabilitycausedbythealterationofsampledata,andthenthegridsearchalgorithmisusedtofindappropriatetrainingsamplesize.Basedonthechar-acteristicsofthesetwoalgorithms,theself-helpgrid
5、searchalgorithmisproposedforsearchinganoptimalSVMclassifieramongmanyofthem.ExperimentalresultshowsthattheSVMClassifierfoundwiththisalgorithmincreasesitslearningprecisionandperformanceeficiently.Astothelargesampledata,throughthesearchwiththisalgorithm,itcanpredictth
6、eperformanceofahugetrainingsetbytheperformanceofthetrainedsamplewhichisrelativelysmall,whichremarkablydecreasesthetrainingtimeofSVMSOastosavethetimecost.KeywordsSVMclassifierBaggingalgorithmSelf-helpgridsearchalgorithmTrainingsamplesnumber的非线性映射‘p(g),数据总能被一个超平面分割。我
7、们假设每0引言个模式变换到=妒(),我们就把问题变为如何选择妒(g)。对Ⅳ个模式中的每一个,k=1,2,⋯,n,根据模式属于。支持向量机(SVM)主要思想是针对两类分类问题而提出或是:,我们分别令=±1,增广空间,,上的判别函数就是:的,在高维空间寻找一个超平面作为两类的分割,以保证最小的g()=Ⅱ‘(a是权向量)(1)分类错误率.2J。SVM的另一个重要的特点是能通过选择合适这里的权向量和变换后的模式向量都是增广的。这样,一的核函数处理样本数据线性不可分的情况。一般来说,在模式分个分隔超平面保证:类问题中,训练样本数据的变
8、化,会引起分类器的不稳定,并且不zg(Y^)≥1(2)同的训练样本数量下的测试精度也是不相同的J。所以,训练样训练一个SVM的目标是找到一个具有最大间隔的分隔平本的选取对分类效果以及精度是至关重要的,如何选取合适的训面,如果间隔越大,得到的分类器也越好。从超平面到变换后的练样本的数量,SV
此文档下载收益归作者所有