资源描述:
《支持向量机的模型选择研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、工学硕士学位论文支持向量机的模型选择研究硕士研究生:林沂蒙导申请师:杨苏教授学位:工学硕士学科、专业:计算机科学与技术所在单位:深圳研究生院答辩日期:2006年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TM151.3U.D.C:621.3DissertationfortheMasterDegreeofEngineeringRESEARCHONMODELSELECTIONOFSUPPORTVECTORMACHINECandidate:Supervisor:AcademicDegreeAppliedfo
2、r:Specialty:Affiliation:DateofDefence:Degree-Conferring-Institution:LinYimengProf.DanielYeungMasterofEngineeringComputerScienceandTechnologyShenzhenGraduateSchoolJune,2006HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要支持向量分类中,高斯核不区分样本中各个特征的重要性.显然,各个特征对分类的贡献一般是不相同的,
3、为了体现这种差别从而提高支持向量机的泛化能力,文中提出了多宽度高斯核的概念.多宽度高斯核增加了支持向量机的超级参数,针对这一情况,文中提出了支持向量机的多参数模型选择的算法,该算法利用半径-间隔的泛化误差期望界自动实现模型选择.通过实验验证了多宽度高斯核和多参数模型选择算法在提高支持向量分类中的有效性.高斯核是支持向量机优先选择的核函数,其宽度参数定义了核函数的泛化规模.由于样本分布的不均匀性,单一宽度的高斯核会在样本空间的稠密区域产生过学习现象,在稀疏区域产生欠学习现象,即存在局部泛化风险.针对于此,文中构造了一个“全局
4、性”的次核去降低高斯核产生的局部泛化风险,次核是为了拟补主核的不足,这里高斯核称为主核,构造的新核称为主次核.文中利用幂级数构造性的给出并证明了次核的正定性条件.进一步提出了基于遗传算法的两阶段模型选择去解决主次核的模型选择问题,该算法通过最小化泛化误差界,首先选择主核的模型参数,然后再选择次核的模型参数,实验证明,这一策略是非常有效和鲁棒的.关键词主次核;高斯核;泛化误差界;支持向量分类;多宽度高斯核;多参数模型选择;I哈尔滨工业大学工学硕士学位论文AbstractToimprovethegeneralization
5、performanceofsupportvectorclassification,theGaussiankernelwithmultiplewidthsisproposedtoemphasizethedifferentcontributionsoffeaturestoclassification.Withthiskernel,therelatedmodelselectionschemeisdesignedwhichcanautomaticallytunemultipleparametersforsupportvectorm
6、achinesbyminimizingtheradiusmarginboundonerrorexpectationofL1-SVM.Theideasarevalidatedviaexperiments.InSVMclassification,Gaussiankernelisfirstlyselectedwithhighperformanceanditswidthdefinesthegeneralizationscale.However,Gaussiankernelisnotwelladaptiveeverywhereint
7、hepatternspaceifthepatternsareunevenlydistributed.Thatis,theover-fittinglearningwillappearindenseareasandotherwiseunder-fittinglearninginsparseareas,andconsequently,bothwillcauselocalrisks.Toreducesuchlocalrisks,asecondarykernelwithglobalcharacterisintroducedwhich
8、canenhanceglobalityforGaussiankernel.Gaussiankernelwithlocalcharacterisusedasprimarykernel.Theconstructedkerneliscalledtheprimary-secondarykernel(PSK).T