基于模糊聚类和粗糙集的连续值属性约简研究

基于模糊聚类和粗糙集的连续值属性约简研究

ID:35066912

大小:3.37 MB

页数:67页

时间:2019-03-17

基于模糊聚类和粗糙集的连续值属性约简研究_第1页
基于模糊聚类和粗糙集的连续值属性约简研究_第2页
基于模糊聚类和粗糙集的连续值属性约简研究_第3页
基于模糊聚类和粗糙集的连续值属性约简研究_第4页
基于模糊聚类和粗糙集的连续值属性约简研究_第5页
资源描述:

《基于模糊聚类和粗糙集的连续值属性约简研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、脅卑巧絳貿矣CapitalUniversityofEconomicsandBusinas硕i学位论文ThesisforDereeofMasterg论文题目;基于模糊聚类和粗趟集的達续值属性约简研究.产业经济学专业22014070549学号:作者.陈晨?指导教师白晓明副教授;誦年6月完成时间;独创性声明本人郑重声明:今所呈交的《基于模糊聚类和粗提集的连续值属性约简研究》论文是我个人在导师指导下进行的研究王作及取得的科研成果。尽我所知,文中除了特別加W

2、标注和致谢的地方外,论文中不包含其他人已经发表或撰写的内容及科研成果也不包含为获得首,都经济贸易大学或其它教育机构的学位或证书所使用过的材料。作者签名:取日期^月^日了少:心/(年关于论文使用授权的说明本人完全了解首都经济贸易大学有关保留、使用学位论文的有关规定,即:学校有权保留送吏论文的复印件,允许论文被查阅、借阅或网络索引可公布论文的全部或部分内容可k义采取影印、缩印或;学校,其它复制手段保存论文。(保密的论文在解密后应遵守此规定)作者签名:导师签名:4咸日期:^年月丄日‘了作刮_1首都经济贸

3、易大学CapitalUniversityofEconomicsandBusiness硕士学位论文THESISOFMASTERDEGREE论文题目:基于模糊聚类和粗糙集的连续值属性约简研究院系:信息学院专业:产业经济学学号:22014070549作者:陈晨指导教师:白晓明完成日期:2016.5.30摘要属性约简是粗糙集理论的研究热点之一,它是一种保证属性分类能力不变的前提下,剔除冗余属性的过程。通过属性约简,可以实现数据表的列压缩,从而降低数据挖掘的数据量,提升挖掘效率。目前基于粗糙集的属性约简算法多数只适用于离散型数据。然而,在现实工作中

4、,不仅有符号、类别等离散型数据,更有大量的连续型数据,甚至二者的混合。因此,在粗糙集属性约简算法的应用中,通常先对连续数据进行离散化处理。然而,离散化处理过程难以保存属性在数值上的差异,难免造成一定程度的信息损失。因此本文深入研究以往文献,提出了一种基于模糊聚类和粗糙集的连续值属性约简算法。基于模糊聚类和粗糙集的连续值属性约简算法主要分为两个部分:第一部分,引入模糊聚类,将属性值上的模糊性转化为对象关系的模糊性,并以此得到论域对象的划分,这部分相当于粗糙集属性约简中的等价类划分;第二部分,同样运用模糊聚类,将相似度贴近的属性聚为一类,并从

5、每一类中选择代表性的属性构成约简属性子集,而在属性子集的评价上,结合了粗糙集依赖度的概念。通过模糊聚类和粗糙集结合算法得到的属性约简,综合考虑了属性的相异性与相关性,在保证属性信息覆盖广度的同时,降低了约简过程的信息损失,并在依赖度概念上保持了信息系统的分类能力不变。区别于以往粗糙集的启发式属性约简算法,基于模糊聚类和粗糙集的属性约简不需要计算核属性,也省去了逐层逐个计算属性重要度的过程,因而在算法上有所提升。最后通过7组UCI标准数据集以及3组经济金融数据的仿真实验,表明本文提出的算法有效,并且在进一步的决策树分类中,基于约简属性的预测

6、精度多数情况下高于全部条件属性的预测精度。关键词:模糊聚类粗糙集属性约简连续值决策表IAbstractAttributereductionisanimportantapplicationstudyofroughset,whichisaprocesstoremovetheuselessattributewithclassificationcapabilityunchanged.Itwillreducetheheavyburdenscausedbylarge-scaledataandcountlessattributesduringdatam

7、ining.However,theattributereductionalgorithmsbasedonroughsetareonlyappropriatefordiscretedata,whichisonekindofdatatypeexistinginrealdatasets.Therefore,adiscretizationprocessisnecessaryforcontinuousdatamining.Whilethisprocessloseinformationtosomeextent,asit’sunabletoreserv

8、ethevaluedifferenceswithinobjects.Hence,inthispaperanalgorithmbasedonfuzzyclusteringandroughsett

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。