基于粗糙集的数据挖掘技术研究

基于粗糙集的数据挖掘技术研究

ID:33326546

大小:1.61 MB

页数:63页

时间:2019-02-24

基于粗糙集的数据挖掘技术研究_第1页
基于粗糙集的数据挖掘技术研究_第2页
基于粗糙集的数据挖掘技术研究_第3页
基于粗糙集的数据挖掘技术研究_第4页
基于粗糙集的数据挖掘技术研究_第5页
资源描述:

《基于粗糙集的数据挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、辽宁师范大学硕士学位论文基于粗糙集的数据挖掘技术研究姓名:刘菲斐申请学位级别:硕士专业:计算机应用技术指导教师:闫德勤20070101摘要随着计算机与网络信息技术的飞速发展,各个领域的数据和信息急剧增加,对这些数据进行分析以发现隐含在数据中的有用模式的要求变的越来越迫切。因此数据挖掘技术应运而生,并得到迅速发展。作为数据挖掘技术的一种有效手段,粗糙集理论凭借其独特的优势在数据挖掘领域中具有越来越重要的地位。将粗糙集应用于数据挖掘领域,篚提高对大型数据库中的不完整数据进行分析和学习的能力,具有广泛的应用前景和实用价值。本文系统的阐述了数据挖掘技术的总体研究情况,深入研究了

2、粗糙集的理论框架、概念基础以及粗糙集理论的核心——知识约简,讨论了知识约简与知识依赖性的关系,知识表达系统与决策表的关系,分析了区分矩阵内容的深层次含义以及它与约简的关系。粗糙集应用于数据挖掘知识获取的成功在于其重要的理论支持。在理论基础上的方法产生重要的应用效果。基于这样的思想基础,本文着重研究了粗糙集数据挖掘的相关理论技术及应用方法。主要创新方面如下:给出了一种适于相容和不相容两种形式信息系统差别矩阵的统一构造方法。证明了使用该差别矩阵求核的J下确性。使用该方法可避免在属性约简时由信息系统的不相容性所可能带来的问题。另~方面,在属性约简中一个属性的删除或添加的依据是

3、其对系统作用的大小,其判据的基础是近似精度(信息熵可以看作另一形式的近似精度),因此近似精度的确定对于信息系统的属性约简至关重要。为进行属性约简提出了一种期望精度表示。证明了应用期望精度比Pawlak所用(目前被广泛使用)的近似精度能够更好地刻画每个属性对信息系统的影响作用。提出了粗糙vague集(RVsets)的概念。Vague集拓广了模糊集(Fuzzysets)对事物表达的范围,同时也提供了一种对知识表示的新工具。Vague集鲜明地定义出人们对事物的可知程度和范围的表示方法,从形式上讲在对事物属性的描述上较模糊集提供了更多的选择方式,从内容上讲是对事物属性更细致的描

4、述。因而己在学术界和工程技术界引起了广泛关注。本文研究了粗糙集与vague集的关系,提出了粗糙vague集(RVsets)的概念,并初步研究了其性质。更进一步地,研究了粗糙vague集的相似度量。提出了一种模糊差别矩阵的概念与构造方法,同时给出了应用方法。利用差别矩阵对信息系统进行属性约简是粗糙集理论方法应用的一个重要方面。传统的差别矩阵的概念与构造方法基于完备属性并且属性值为符号型的信息系统。然而,对于模糊或实值属性信息系统的属性约简传统的差别矩阵难于适用。虽有粗糙集扩展模型以及实值(连续)属性分段方法的提出,但由于数据的多样性以及这些方法本身的限制,在应用时存在着各

5、种各样的问题。找出模糊或实值属性信息系统属性约简的好的方法仍然是当前这一领域研究的重要方面。模糊属性信息系统的属性约简与实值属性信息系统的属性约简关联密切,对模糊属性信息系统的属性约简方法可借用到实值属性信息系统的属性约简中去。从这个意义上讲,研究模糊属性信息系统的属性约简具有重要性。在属性约简研究与应用中,差别矩阵是一个重要的概念,也是粗糙集理论方法的一个重要部分。由于对于模糊属性信息系统现有的差别矩阵方法难于使用,本文提出了一种模糊差别矩阵的概念与构造方法,同时给出了相关的定理和应用举例。关键词:数据挖掘;粗糙集;知识约简;差别矩阵ABSTRACTAlongwith

6、therapidlydevelopingofcomputerandnetworkteelmiques,theamouatofinformationinallfieldsisexplosivelyincreasing.Thereforetherequirememofanalyzingthedatatoretrieveusefulpatternsconcealedinthosedataismoleandllloreurgent.Inthissituation,anewtechnology,datamininghasappearedandflourishedinashortt

7、ime.As细effectivemethodofdatamillin函roughsettheoryhasalsobecomeamainmethodfordataminingcluetoitsuniqueadvantage.Applyingroughtheoryindataminingfieldcsnimprovetheanalyzingandlearningabilityforincompletedataoflargedatabase,whichhasextensiveappliedprospectandappliedvalue.Thei

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。