欢迎来到天天文库
浏览记录
ID:35082133
大小:1.46 MB
页数:48页
时间:2019-03-17
《支持向量机的特征选择和模糊支持向量机上的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中文图书分类号:O221.2密级:公开UDC:510学校代码:10005论文题目:支持向量机的特征选择和模糊支持向量机上的研究论文作者:杨休学科:数学指导教师:薛毅教授论文提交日期:2016年6月UDC:510学校代码:10005中文图书分类号:O221.2学号:S201306036密级:公开北京工业大学理学硕士学位论文题目:支持向量机的特征选择和模糊支持向量机上的研究英文题目:THEORYBASEDFUZZYSVMANDFEATURESELECTION论文作者:杨休学科:数学研究方向:最优化理论及应用申请学位:理学硕士指导教师
2、:薛毅教授所在单位:应用数理学院答辩日期:2016年6月授予学位单位:北京工业大学独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:杨休日期:2016年6月7日关于论文使用授权的说明本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交
3、论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)签名:杨休日期:2016年6月7日导师签名:薛毅日期:2016年6月7日摘要摘要随着互联网的发展及数字化时代的来临,产生了越来越多的高维数据。尽管这些数据非常值得学习和研究,但维数的增加意味着要花费更多的时间去计算,并且在机器学习中,容易产生过拟合现象。在处理分类问题的过程中,特征选择被证明可以有效的应对高维数据。特征选择致力于去除数据的不相关或多余特征。通过寻找原问题的一个特征子集,
4、特征选择可以有效地降低数据的维数。从而,在机器学习过程中,非常值得去研究如何进行特征选择。近年来,虽然许多特征选择方法被提出,但很少有人考虑特征之间的相关性。本文提出了一种新的特征选择方法,以特征间的相关性作为特征选择的依据,考虑应用单一特征等价的代替其他与之相关的特征,从而达到寻找特征子集,降低数据维数的目的。实验结果表明,此方法在保持分类正确率的前提下,可以有效减少特征的个数。此外,由于各种客观原因,数据中不可避免出现噪音数据,从而给机器学习带来困难,影响机器学习的结果。模糊支持向量机,作为传统支持向量机的一种改进模型,提出
5、了隶属度的概念。通过赋予正常的样本点较高的隶属度,相反的,赋予噪音较低的隶属度,可以有效的降低噪音对机器学习的影响。本文提出应用将样本点到超平面间距离与样本点密度相结合的方法,计算模型的隶属度。实验结果表明,此方法可以有效提高支持向量机分类的正确率。关键词:支持向量机;特征选择;模糊支持向量机;隶属度-I-AbstractAbstractWiththedevelopmentoftheinformation,itismorelikelytoencounterhigh-dimensionaldatasets.Althoughitis
6、worthstudy,costlycomputationmakeitisdifficult.Besides,itisoccursoverfittingwhenMachineLearning.Meanwhile,featureselectionisprovedtobeefficientwhendealwithclassificationissueonhigh-dimension.Byfindasubset,featureselectioncaneffi-cientlydecreasedimension,anditisalsodowellone
7、liminateirrelativeandredundantfeatures.SoitworthtodofeatureselectwhenMachineLearning.Fortheseyears,althoughtherearelotsoffeatureselectionmethodsbepurposed,fewofthemthinkaboutrelationbetweenfeatures.Thispaper,purposeafeatureselectmethods,takecorrelationbetweenfeatures
8、asastandardtoeliminatethem,andalsopurposethatitisonlyneedonefeatureiftheyhavehighcorrelation.Bydoingthis,thismethodcanefficientlydec
此文档下载收益归作者所有