基于集成学习的特征选择算法的设计与实现.pdf

基于集成学习的特征选择算法的设计与实现.pdf

ID:35168383

大小:1.42 MB

页数:62页

时间:2019-03-20

基于集成学习的特征选择算法的设计与实现.pdf_第1页
基于集成学习的特征选择算法的设计与实现.pdf_第2页
基于集成学习的特征选择算法的设计与实现.pdf_第3页
基于集成学习的特征选择算法的设计与实现.pdf_第4页
基于集成学习的特征选择算法的设计与实现.pdf_第5页
资源描述:

《基于集成学习的特征选择算法的设计与实现.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于集成学习的特征选择算法的设计与实现RESEARCHANDIMPLEMENTATIONOFFEATURESELECTIONALGORITHMBASEDONENSEMBLELEARNING黎竹平哈尔滨工业大学2018年6月国内图书分类号:TP319.4学校代码:10213国际图书分类号:681.39密级:公开工程硕士学位论文基于集成学习的特征选择算法的设计与实现硕士研究生:黎竹平导师:张岩副教授申请学位:工程硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2018年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP319.4U.

2、D.C:681.39DissertationfortheMasterDegreeinEngineeringRESEARCHANDIMPLEMENTATIONOFFEATURESELECTIONALGORITHMBASEDONENSEMBLELEARNINGCandidate:LiZhupingSupervisor:Prof.ZhangYanAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofComputerSciencean

3、dTechnologyDateofDefence:June,2018Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要近年来随着计算成本和存储成本的降低,集成学习成为机器学习领域的一个热门方向,通过模型的组合,能同时获得模型在计算能力和计算准确度这两个方面的巨大突破。集成方法根据基学习器和训练数据的不同,主要分为异质集成和同质集成。目前,将集成学习的思想应用在特征选择上的相关算法较多,但大多数集成特征选择方法都赋予了基学习器相同的权重,事实上,不管是异质集成和同质集成,在训练过程

4、中均会产生不同的基学习器,各个基学习器对于训练集的适应程度不同,因此,我们针对集成特征选择方法在该方面的不足,提出了不同的基于权重调节的集成特征选择方法。针对同质集成,本文提出了基于softmax的集成特征选择方法,我们利用softmax函数,结合每个基学习器对数据集的适应度,对基学习器的投票权重进行调节,对于适应度较好的基学习器,其投票权重较高,同时,本文对该方法相比于无权重调节的集成特征选择方法在泛化能力上的提升进行了理论分析,并通过实验验证了基于softmax函数的集成特征选择方法在泛化性能上要优于无权重调节的集成特征选择方法。针对异质集成,本文提出了基于遗传算法的集成

5、特征选择方法,该方法利用遗传算法对基学习器权重向量进行评估、迭代以及优化,得到最优的权重向量。针对返回的权重向量的类型,该方法分为两种——基于最优权值的集成特征选择方法和选择性集成特征选择方法,其中基于最优权值的集成特征选择方法返回的权重向量为连续型,选择性集成特征选择方法返回的权重向量为离散型,最后通过实验验证了这两种方法相比于无权重调节的集成方法在泛化能力上更具优势。此外,在基于遗传算法的集成特征选择的基础上,针对遗传算法不擅长处理连续问题以及计算复杂度高的缺陷,本文提出了基于粒子群算法的集成特征选择方法,最后通过实验验证了该方法在速度上的优势。关键词:特征选择;集成学习

6、;优化算法I哈尔滨工业大学工学硕士学位论文AbstractIntherecentyears,withthecostreductionofcalculationandstorage,ensemblelearninghasbecomeahotdirectioninmachinelearning.Throughthecombinationofmodels,theensemblemodelcanachieveahugebreakthroughinbothcomputingpowerandcalculationaccuracy.Accordingtothedifferencesofth

7、ebaselearnerortrainingdata,theintegrationmethodismainlydividedintoheterogeneousapproachesandhomogeneousapproaches.Atpresent,therearesomedimensionreductionideawhichapplyensemblethinkingintothemodelingbasedonfeatureselection,butthebaselearnerhasbeenassigne

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。