基于属性关联度的启发式约简方法

基于属性关联度的启发式约简方法

ID:15095227

大小:775.50 KB

页数:36页

时间:2018-08-01

基于属性关联度的启发式约简方法_第1页
基于属性关联度的启发式约简方法_第2页
基于属性关联度的启发式约简方法_第3页
基于属性关联度的启发式约简方法_第4页
基于属性关联度的启发式约简方法_第5页
资源描述:

《基于属性关联度的启发式约简方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1.本课题所涉及的问题及应用现状综述粗糙集理论中有效算法的研究是粗糙集理论在人工智能研究中的一个主要方向。目前,粗糙集理论中有效算法研究主要集中在规则提取、属性约简算法以及与粗糙集有关的神经网络和遗传算法研究等。属性约简是粗糙集理论的核心问题之一。属性约简的任务就是在保持知识表达系统中分类能力不变的情况下,删除其中不相关或不重要的属性。但是己经证明求解所有约简和求解最小约简都是NP-hard问题。属性约简与核的求解一直就是粗糙集理论研究的热点与难点。2.本课题需要重点研究的关键问题、解决的思路及实现预期目标的可行性分析粗糙集理论一这种研究不完整、不确定知识和数据的表达、学习、归纳的理论

2、方法,便不失为一种处理复杂系统的较为有效的方法。随着信息时代的到来,数据不断增长,并且在很多情况下数据中含有大量的冗余信息和噪声。那么如何从大量的、杂乱无章的、带干扰的数据中挖掘潜在的、有利用价值的信息(知识),即是寻找最快方法对最普遍、更一般的信息系统的有用知识的提取。在探索的过程中,讨论各种理论支持下的约简方法,比较方法的有效性,并随之将方法在理论的基础上进行推广,逐渐更人性化、更能被人们所理解的处理更一般的信息系统。而粗糙集中分辨矩阵和依赖度两工具,实用性与理解性比较强,可较为有效的用于一般的决策表中。而把依赖空间引入到属性约简(即在依赖空间中对属性约简进行讨论)具有一定的理论和

3、实际意义及应用前景。3.完成本课题的工作方案对粗糙集理论进行研究,理解属性约简的作用与现实意义。了解灰度理论模型,并将此概念能引入到粗糙集理论中,计算其条件——决策属性关联度,衡量各条件属性的重要性,以此作为启发式信息,设计相应的约简算法。编程实现一个具体的属性约简系统。题目应完成的工作方案如下:(1)掌握粗糙集理论中有关数据约减方法的原理;(2)掌握灰色理论模型在粗糙集理论中的应用;(3)选择合适的实验数据集,并设计数据库;(4)设计正确、合理的数据结构;(5)编程实现一个基本的应用系统。4.指导教师审阅意见指导教师(签字):  年月日说明:本报告必须由承担毕业论文(设计)课题任务的

4、学生在毕业论文(设计)正式开始的第1周周五之前独立撰写完成,并交指导教师审阅。目录摘要IABSTRACTII1引言12绪论22.1粗糙集理论的研究现状22.2本文的工作42.3本文的组织43粗糙集的基础理论53.1粗糙集理论概况53.1.1粗糙集的研究对象53.1.2粗糙集理论的特点53.2知识与知识库63.3不可分辨关系与上、下近似集73.4信息系统93.5知识的依赖性103.6属性约简与核114关联属性约简算法及其改进144.1分辨矩阵及基于分辨矩阵的算法144.2启发式属性约简算法164.3算法改进175基于属性的灰度的属性约简方法205.1定义与算法205.2算法实例分析216

5、研究工作总结与展望266.1研究工作总结266.2研究工作展望27致谢29参考文献30摘要粗糙集理论是一种处理含糊和不确定性信息的新型数学工具,其理论提出以来得到迅速的发展和广泛的应用。而知识约简是粗糙集理论重要研究内容之一,它的主要目的在于去除数据中的冗余信息,同时保持原决策信息系统的分类能力不变。当出现大量或海量数据时,原有约简方法效率就会变低,所以须对粗糙集约简计算理论进行优化,并且发展完善相关计算算法,以提高知识约简的效率。本文首先基于粗糙集理论,针对知识约简优化计算问题提出了两种知识约简方法,分析了这两种方法之间的关系以及它们的优缺点。并根据关联度以及灰度的理论分析,提出了减

6、少执行时间的改进算法,降低了算法的时间复杂度,并最终完成了实验仿真。根据仿真结果得出结论:虽然经典的基于分辨矩阵的属性约简算法就约简后属性个数而言,比另外两种算法的效率有所提高,但其执行时间要高出很多,尤其当实例数较大时,执行时间会高出数倍左右。该结论有助于改进知识约简的效率,进一步提高粗糙集数据分析能力。关键词:粗糙集,属性约简,差别矩阵,关联度-II-ABSTRACTRoughSetTheoryisanewmathematicaltooltoreasonaboutuncertainandvagueinformation.Ithasbeenrapidlydevelopedandwid

7、elyappliedinmanyfields.Reductisthemostimportantconceptinroughset,whosemainpurposeistoremovetheredundantinformationandpreservesclassificationaccuracyoforiginalinformationsystem.Facingwithhugeamountsofdata,theoldalgorithmsforr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。