欢迎来到天天文库
浏览记录
ID:37065532
大小:2.59 MB
页数:60页
时间:2019-05-17
《基于距离加权支持向量回归的递归特征剔除研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP391单位代码:10183研究生学号:2015532081密级:公开基于距离加权支持向吉林大学量回归的硕士学位论文递归(学术学位)特征剔除基于距离加权支持向量回归的递归特征剔除研究研究DistanceWeightedSupportVectorRegressionRecursiveFeature欧Elimination歌作者姓名:欧歌吉专业:计算机应用技术林大研究方向:机器学习学指导教师:王岩教授培养单位:计算机科学与技术学院2018年4月基于距离加权支持向量回归的递归特征剔除研究DistanceWeightedS
2、upportVectorRegressionRecursiveFeatureElimination作者姓名:欧歌专业名称:计算机应用技术指导教师:王岩教授学位类别:工学硕士答辩日期:年月日未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。否则,应承担侵权的法律责任。吉林大学硕士学位论文原创性声明本人郑重声明:所呈交的硕士学位论文,是本人在指导教师的指导下,独立进行研究
3、工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其它个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日《中国优秀博硕士学位论文全文数据库》投稿声明研究生院:本人同意《中国优秀博硕士学位论文全文数据库》出版章程的内容,愿意将本人的学位论文委托研究生院向中国学术期刊(光盘版)电子杂志社的《中国优秀博硕士学位论文全文数据库》投稿,希望《中国优秀博硕士学位论文全文数据库》给予出版,并同意在《中国博
4、硕士学位论文评价数据库》和CNKI系列数据库中使用,同意按章程规定享受相关权益。论文级别:■硕士□博士学科专业:计算机应用技术论文题目:基于距离加权支持向量回归的递归特征剔除研究作者签名:指导教师签名:年月日作者联系地址(邮编):吉林大学计算机科学与技术学院130012作者联系电话:17843108321摘要摘要基于距离加权支持向量回归的递归特征剔除研究随着大数据时代的到来,数据的样本数量和特征维度也随之增高,从这些高维数据中选取重要的特征建立精简有效的机器学习模型已经变得十分重要。在机器学习的实际应用中,特征数量往往较多,
5、这些特征中可能有很多特征与要解决的实际问题并不相关,并且过多的特征也会带来计算量大、推广能力差等问题,而特征选择这一过程可以很大程度上避免过拟合现象,降低模型的复杂度,从而达到降低时空复杂度的目的。因此,研究特征选择算法对构建机器学习模型具有非常重要的意义。特征选择是模式识别中关键的数据预处理步骤,是提高学习算法性能的一个必要手段。常见的特征选择方法有很多,但这些方法往往属于通用方法,即它们没有考虑不同机器学习任务的特殊性。但是,有些特征选择方法则是与具体的机器学习模型相结合,并将该模型的建立融入到特征选择过程中,比如包裹法
6、,而包裹法中最常用的方法就是递归特征剔除方法。在本文的研究问题中,主要考虑回归分析领域中的特征选择问题。由于递归特征剔除方法不仅可以实现很好的特征选择效果,同时具有处理高维数据的能力,因此,该方法为本文的研究方向。本文首先对原有的支持向量回归算法进行改进,提出了一种新的回归分析算法,即距离加权支持向量回归算法。该算法对噪声具有很好的鲁棒性,并且不易受到包括支持向量在内的边缘数据分布的影响,因此可以实现比较好的拟合效果。之后,本文基于距离加权支持向量回归算法,实现了一种特殊的递归特征剔除方法。该方法对参数变化不敏感,同时也具有
7、很好的鲁棒性。基于距离加权支持向量的递归特征剔除法主要根据每个特征对距离加权支持向量回归算法的贡献大小进行排序,然后从特征集合中递归地剔除不重要的特征。最后,本文将新提出的方法在真实数据集上与其他常用的特征选择方法进行实验比较,如PCA、逐步回归、LASSO和基于支持向量回归的递归特征剔除法。另外,本文还进行一组随机实验,即将特征集合随机打乱,以此来验证实验的合理性。最终的实验结果表明本文的方法与其他方法相比在UCI数据集上具有更好的特征选择效果。I摘要关键词:特征选择,回归分析,距离加权支持向量回归,递归特征剔除方法IIA
8、bstractAbstractDistanceWeightedSupportVectorRegressionRecursiveFeatureEliminationWiththeadventofbigdataera,thenumbersofsamplesandthedimensionalit
此文档下载收益归作者所有