基于信息粒化的特征选择算法研究

基于信息粒化的特征选择算法研究

ID:35060919

大小:5.06 MB

页数:85页

时间:2019-03-17

基于信息粒化的特征选择算法研究_第1页
基于信息粒化的特征选择算法研究_第2页
基于信息粒化的特征选择算法研究_第3页
基于信息粒化的特征选择算法研究_第4页
基于信息粒化的特征选择算法研究_第5页
资源描述:

《基于信息粒化的特征选择算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、刮油钟裝乂逢'产工学硕壬学位论文?一...—-??■基于信息粒化的特征选择算法研巧刘景华闲南师范大学二0—六年六月'—*.闽南师范大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研巧所取得的研究成果。除了文中特别加内容外,本论文不包含任何其他个人或集体已经发表^^^示注引用的或撰写的成果作品。对本文的研巧做出重要贡献的个人和集体,均己在文中W明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者铭名日期^^年月备^_^1_^曰学位论文版权使用授极书本学位论文作者完全了解学校有关保留、使用

2、学位论文的规定,同意学校保留并向。本人授权闽園家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅南师范大学可封将本学位论文的全部或部分內容编入有关数据库进行检索,可采用影印。、缩印或扫描等复制手段保存和汇编本学位论文本学位论文属于K保密□。,在年解密后适用本授杖书2、不保密因""(请在上相应方内打V)^作者签名;曰期年月S日导师签名;日期年月曰/学校代码:10402学号:2013062002分类号:密级:工学硕士学位论文基于信息粒化的特征选择算法研究学位申请人:刘景华指导教师:林梦雷教授林耀进副教授学位类别:工学硕士学科专业:计算机应用技术

3、授予单位:闽南师范大学答辩日期:二○一六年六月CODE:10402NO.:2013062002U.D.C.:ClassifiedIndex:ADissertationfortheDegreeofEngineeringResearchonFeatureSelectionAlgorithmsusingInformationGranulationCandidate:LiuJing-huaSupervisor:Prof.LinMeng-leiAsso.Prof.LinYao-jinSpecialty:ComputerapplicationtechnologyAcademicDegreeAppliedf

4、or:MasterofEngineerUniversity:MinnanNormalUniversityDateofOralExamination:June,2016中文摘要摘要特征选择作为数据预处理的关键手段,是数据挖掘、模式识别和机器学习等领域的重要研究课题之一。它是指在原始数据中删除大量无关和冗余的特征,找到一组包含原始特征空间的全部或大部分分类信息的特征子集的过程。对于高维数据,借鉴表征整体的思想,将数据集由一个大信息粒细化为多个可有效表征其整体的小信息粒,有助于从多层次、多视觉分析数据。因此,本文利用信息粒化的表征机制,将其运用于特征选择中,并构造了一系列的基于信息粒化的特征选择模型

5、。本文首先介绍特征选择问题的研究现状,重点讨论了邻域粒化,大间隔和局部子空间模型。然后,针对数据中冗余和无关特征的消除问题,以粒化为基础,分别从样本粒化、特征粒化以及样本特征双重粒化三个角度,展开一系列的研究来解决不同的数据分类预测问题,本文主要的研究成果有:(1)从样本粒化角度出发,结合特征本身具有质量这一情况,提出了基于特征质量的特征选择算法。该算法根据信息熵和大间隔分别定义了特征质量和最近邻,并利用该近邻实现了样本的粒化。实验从特征子集的紧凑性,分类精度,以及分类精度随着特征数目的变化情况这三方面对模型进行了验证,结果表明基于特征质量可以选择一组有效的特征子集。(2)从样本粒化角度出发,

6、采用邻域关系,提出了基于最大近邻粗糙逼近的特征选择算法MNNRS。该算法以邻域粗糙集的特征选择算法NRS为框架,利用大间隔定义了最大近邻来粒化样本,并修正了正域的计算方法。MNNRS算法保留了NRS算法的优点,且有效降低了计算复杂性,提高了算法的分类性能。(3)从特征粒化角度出发,针对多标记数据集的高维性和标记与特征之间存在的类属关系,提出了基于局部子空间的多标记特征选择算法。该算法以局部子空间模型为基础,结合信息熵理论,鉴别了多标记中对标记集合相对次要,但却不可遗漏的特征。实验表明该算法能有效降低计算复杂性,提高分类性能,增强选择策略的灵活性。(4)从样本粒化和特征粒化角度出发,针对高维小样

7、本数据存在高维性和易导致过拟合的问题,提出了一种启发式的局部随机特征选择方法。该算法利用局部子空间模–I–闽南师范大学工学硕士学位论文型来粒化特征,结合样本的邻域粒化,以提高分类模型的分类精度,降低计算代价,并在一定程度上解决了过拟合问题。关键词:特征选择;信息粒化;大间隔;局部子空间;邻域粗糙集–II–英文摘要AbstractFeatureselectionasameansofdataprepr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。