基于差分演化算法的粗糙集离散化与属性约简的研究

基于差分演化算法的粗糙集离散化与属性约简的研究

ID:32232903

大小:1.89 MB

页数:60页

时间:2019-02-01

基于差分演化算法的粗糙集离散化与属性约简的研究_第1页
基于差分演化算法的粗糙集离散化与属性约简的研究_第2页
基于差分演化算法的粗糙集离散化与属性约简的研究_第3页
基于差分演化算法的粗糙集离散化与属性约简的研究_第4页
基于差分演化算法的粗糙集离散化与属性约简的研究_第5页
资源描述:

《基于差分演化算法的粗糙集离散化与属性约简的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、TheResearchofDiscretizationandAttributeReductionofRoughSetsBasedonDifferentialEvolutionAlgorithmGAOYiB.E.(ChangshaUniversity)2008AthesissubmittedinpartialsatisfactionoftheRequirementsforthedegreeofMasterofEngineeringComputerApplicationTechnologyChangshaUniversit

2、yofScience&TechnologySupervisorProfessorYahHongwenMarch,20ll㈣5Ⅲ8舢0舢4舢8M8舢1舢Y飞謦l雾磐v≯≮长沙理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:南童。日期:z驯1年,月2P日学位论文版权使

3、用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权长沙理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研究所将本论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。本学位论文属于l、保密口,在年解密后适用本授权书。2、不保密团。(请在以上相应方框内打“√")作者签名:导师签名:I当童苏宏丈日期:≥口f1

4、年f月2丫日日期:b『1年j月修日摘要当前,数据挖掘已广泛应用于金融、制造和医疗等领域。但随着知识库的信息量急剧增加,人类迫切需要一类工具能从数据量大、冗余多,且存在噪声数据干扰的知识库中提取潜在有价值的规则。由于粗糙集在这些方面具有优良性能,其已越来越多地应用于数据挖掘。实际应用的知识库存在大量连续数据,而以等价关系为核心的粗糙集只能处理离散数据。因此,在利用粗糙集方法(如属性约简)处理连续数据之前必须将其离散化。本文分析比较了各无监督离散化方法和有监督离散化方法的优缺点,针对最优离散化是一个NP.hard问题的性质

5、,提出了一种启发式离散化方法一一基于差分演化算法的离散化算法。该算法采用实数串表示个体,增强了对局部最优点的搜索能力,并在此基础上给出了二值个体和一种适应值函数的定义形式,其中二值个体的定义形式上因条件属性而异设置不同的阈值,适应值函数考虑到了粗糙集理论的特殊性。最后通过Iris数据集的测试实验,验证了该算法是有效的。知识库的各属性的重要性并不是等同的,在确保不改变知识库的分类能力的前提下,可以删除其中冗余的或者重要性较低的属性。本文探讨了属性约简的启发式算法,缘于最小属性约简的求解是一个NP.hard问题,并提出了一

6、种基于差分演化算法的属性约简算法,分别讨论了其在相容决策表和不相容决策表中的约简情况,进而引出了一种新的适应值函数定义形式和一种新的差分操作使变异向最小属性约简相应的个体进化。最后通过两组实验证明该算法是有效的,它的计算复杂度与基于遗传算法的属性约简的计算复杂度相当,但它的收敛速度是基于遗传算法的4倍。关键词:粗糙集;差分演化算法:离散化;属性约简ABSTRACTCurrently,DataMininghasbeenwidelyusedinthefieldsoffinance,manufacturingandmedic

7、alcareetc.Butwiththedramaticincreaseofinformationintheknowledgedatabase,humanbeingsurgentlyneedtoolsthatcanextractpotentialandvaluablerulesfromtheknowledgedatabasewithlargeandredundantdata,andinterferenceofnoisedata.SinceRoughsetsTheoryhasexcellentperformanceint

8、heseaspects,ithasbeenappliedintheDataMiningincreasingly.Therearealotofcontinuousdataintheknowledgedatabaseinpracticalapplications,buttheRoughSetsTheorybasedontheequiv

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。