欢迎来到天天文库
浏览记录
ID:37027780
大小:3.68 MB
页数:56页
时间:2019-05-15
《基于Sparse group lasso相关惩罚项特征选择研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号241.5编号0^^^硕士学位论文⑩论文题目基于Sparsegrouplasso相关惩罚项特征选择研究作者姓名陈文雯指导教师吴庆标教授学科(专业)计算数学所在学院数学科学学院提交日期二零一八年一月答辩二零一八年三月日期浙江大学研究生学位论文独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研宄成果,论文中不包含其他人已经。除了文中特别加以标注和致谢的地方外发表或撰写过的研宄成果,
2、也不包含为获得浙江大学或其他教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。^:签字日期/ib.学位论文作者签名%:\学位论文版权使用授权书本学位论文作者完全了解浙江大学有权保留并向国家有关部门或机构送。交本论文的复印件和磁盘,允许论文被查阅和借阅本人授权浙江大学可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密
3、后适用本授权书)学位论文作者签名 ̄:作L钇导师签名-如丨乂>公:\%.l:签字口期y.h;签字日期摘要随着近年来数据量的爆炸式增长以及大数据概念的持续升温,数据降维技术受到了越来越多的关注,也。特征选择可以有效地进行数据降维有各种各样的方法。许多学者使用惩罚回归的方法来进行特征的选择,其中使用最广泛一L的方法之就是asso。目前,国内外的学者在这方面己经有很多的研宄成果,提出了包括Lasso、Grouplasso、Fusedlasso、Grahlass
4、o在内的许多方法。p本文针对Sarserouplaaso算法在实际应用中存在的不足,以其为基础,pg一:提出了算法三方面的改进第,改进了损失函数,在损失函数加入了组与组一之间的相关关系项,以减小模型中非零特征间的共线性现象,得到进步稀疏化的系数;第二,增加了数据预处理步骤,丰富了用来建立模型的数据集,目的是希望不仅能得到各组特征各自对结果的影响,还能得到它们共同产生的影响,,;第三将算法推广到其他的线性模型并以逻辑回归为例给出了改进之后一的损失函数,,。最后我们使
5、用模拟数据来验证算法的效果并将算法应用在个电影评分的数据集上。:;L;rseoul关键词数据降维;特征选择assoSpagrpassoAbstractWiththeexplosivegrowthofdatainrecentyearsandthecontinuousriseoftheconceptofbigdata,datadimensionreductiontechnologhasdrawnmoreyt.rltandmore
6、attenionFeatueseectioncaneffectivelyreducehedimensionalitofythedata.Therearcalsoavarietyofmethodstoselectfeatures.Manscholarsyusethemethodofregressiontocarryouttheselectionoffeaturesoneofthe,mostwidelyusedisl
7、asso.Atpresentscholarsathomeandabroadhavemade,alotofresearchachievementsinthisfieldandsomemethodsincludinlasso,g,grouplassofusedlassoandrahlassohavebeendeveloed.,gppInthisaperbasedontheshortcominsofsaxseroulass
8、oalorithmp,gpgpginpracticalapplicationthispaperproposesthreeimprovementsinalorithm;,gFirstlthelossfunctionisimrovedandthecorrelationbetweenrouandy,p,gpddth--groupisaedtoelossfunctiontoreduce
此文档下载收益归作者所有