试析基于粗糙集的数据挖掘约简算法的研究与应用

试析基于粗糙集的数据挖掘约简算法的研究与应用

ID:34822557

大小:2.68 MB

页数:86页

时间:2019-03-11

试析基于粗糙集的数据挖掘约简算法的研究与应用_第1页
试析基于粗糙集的数据挖掘约简算法的研究与应用_第2页
试析基于粗糙集的数据挖掘约简算法的研究与应用_第3页
试析基于粗糙集的数据挖掘约简算法的研究与应用_第4页
试析基于粗糙集的数据挖掘约简算法的研究与应用_第5页
资源描述:

《试析基于粗糙集的数据挖掘约简算法的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西南虫謦硕士学位论文Y937821基于粗糙集的数据挖掘约简算法的研究与应用论文作者:阎桦指导教师:余建桥教授学科专业:农业机械化工程研究方向:计算机应用提交论文日期:2006年5月17日论文答辩日期:2006年6月5日学位授予单位:西南大学中国·重庆2006年5月摘要基于粗糙集的数据挖掘约简算法的研究与应用农业机械化专业硕士研究生阎桦指导教师余建桥教授(摘要)随着信息技术的高速发展,数据库应用的规模不断扩大,原有的数据库处理方法己经远远不能满足现实需要,数据挖掘正是为迎合这种需要而产生并迅速发展起来的一种新

2、的数据处理技术。它能够在没有明确假设的前提下,自动地从数据中抽取隐含的、具有潜在应用价值的信息,经过检验和验证,然后返回对用户最有用的结果。目前数据挖掘已经被越来越多的领域所采用,具有广泛的应用前景。在数据挖掘的过程中,存在大量冗余数据影响我们的决策,粗糙集理论在得到的决策规则和推理过程方面是最有利的工具。它不但可以在不影响数据表达信息的前提下使原来的数据量大为减少(数据浓缩),而且还可以产生决策规则,从而挖掘出数据中的有效模式。粗糙集理论不同于其他处理不确定性问题的理论,如概率方法、模糊集方法和证据理论方

3、法等,它无需提供任何所需处理数据集合之外的先验信息。本文首先对基于粗糙集的数据挖掘过程——数据预处理、约简及规则获取进行研究。其次,对挖掘过程中的核心问题——约简,进行了深入的探讨,对目前的约简算法展开分析,指出了其中存在的问题。其次,针对目前较多的启发式算法为了减少时间代价,无法得到决策表最小约简,且时间复杂度与空间复杂度仍然在IuI2(IuI为决策表中记录数)的问题,提出一种既可以降低时间复杂度和空间复杂度,又可以求得最小约简的算法一基于DHI(区分矩阵属性约简改进算法)的改进算法。主要内容如下:1.对

4、DMI算法进行了分析,举例说明了该算法对于不相容决策表的不正确性:然后给出了一种对相容决策表与不相容决策表都适合的改进约简算法。2.针对目前的约简算法必须反复遍历决策表各个数据项,使时间复杂度、空间复杂度较高的现状进行了改进,改进后的算法不用遍历完一次决策表就可以实现约简,大大减少了算法的时间和空间复杂度。3.突出了属性值约简对数据约简的重要性,真正实现了决策表的最简化。并提出改进的值约简算法,时间复杂度在原有基础上大大减少。4.将3个对约简的改进思想融合在一个算法当中,成为真正意义上的约简算法,实现了属性

5、约简和属性值约简的一体化。同目前普遍存在的用不同算法独立处理属性约简和属性值约简的方法相比,本算法的空间复杂度大大减少。因此,本算法具有很强的实践意义和应用前最。5.算法的整个约简过程都是针对所有对象同时进行,真正考虑到了齄个决策类对约简的意义,避免了发生求得局部最优的错误。西南大学硕士论文经对ucI中数据集的实验,结果证明了改进算法的有效性与高效性。最后,将本文提出的约简改进算法用于《农业水价改革与农民承受能力研究》课题的研究。首次提出将数据挖掘用于农业水资源管理领域,并成功建立模型,得到的规则和一线专家

6、的经验相吻合,证实了该算法的先进性和实用性。关键词:数据挖掘,粗糙集,约简,区分矩阵llAbstractWiththerapiddevelopmentofinformationtechnology,theapplicationofdatabasebecomemoreandmorewidelyindifferentareas,andthepreviousprocessingmethodsofdatabasecan’tmeettheneedsanymore,Dataminingisanewtechnologyo

7、fdataprocessingtomeettheneeds.Itcantakeoutthepotentialusefulonesamonyagreatdealofinformationautomatically,andtestandverifythem,returningthemostusefulresultstotheuserswithoutanyexplicithypotheses.Thistechnologyiswidelyusedinmoreandmoreareas;ithasabrightfutu

8、reinapplication.Theroughsettheorysolvestheproblemofagreatdealofredundantdamthatinfluenceourdecisionbytheruleofdecisionandtheprogressofreasoning.Itcallnotonlydecreasethedataamount(dataconcentration),butalsopro

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。