欢迎来到天天文库
浏览记录
ID:33502272
大小:1.86 MB
页数:61页
时间:2019-02-26
《一种基于粗糙集的不完备信息处理方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、湖南大学硕士学位论文一种基于粗糙集的不完备信息处理方法研究姓名:张在美申请学位级别:硕士专业:计算机系统结构指导教师:李仁发20070115硕十学位论文摘要在现实数据库知识发现过程中,由于数据采集能力有限或数据丢失等原因,使得所面临的数据库往往是不完备的信息系统,即可能存在部分对象的某些属性值未知的情况。空缺数据的处理非常关键,因为不完备的数据能够使知识挖掘过程陷入混乱,导致不可靠的输出,将严重影响挖掘的效果。粗糙集理论作为一种处理模糊、不确定知识的数学方法,其显著的优点是无需提供所需处理的数据集合之外的任何先验信息,近年来已在知识发现上取得了令人瞩目的研究成果。目的,基}:羊n糙集理论
2、的不完备信息系统知识发现的理论框架已基本完整,但在具体知识获取的多样性及知识质量的提高方面还需要进一步努力。本文的主要工作就是以粗糙集理论为工具,对知识发现过程中信息不完备问题的处理方法进行研究,以提高知识发现的质量和效率。不完备信息系统的知识发现有两种实现途径:一是采用数据补齐算法对缺失值进行填充,在完备化的信息系统基础上进行知识获取;二是在不改变原不完备信息系统的基础上直接进行知识获取。本文从这两种途径入手,利用粗糙集的方法,提出了两个不完备信息处理的有效算法。首先,分析了目前数据补齐算法存在的缺陷及产生这些缺陷的原因。通过对拓展粗糙集理论模型作进一步的改进,并合理引入分治思想,提出
3、了。种新的数据补齐算法。结合理论分析和实例阐述了算法的有效性,并通过在UCI机器学习数掘库中选取的两个数掘集上进行实验,验证了该算法不仅能够提高补齐率,而且能显著降低算法复杂性。其次,本文在不改变原不完备信息系统的基础上,分析了现有知识约简算法的局限性,扩展定义了不完备熵概念,与传统聿日糙熵结合,对不完备信息系统中的属性重要性进行了定义,并以此作为启发式信息,提出了一种优化的不完备信息系统知识约简算法,与传统方法相比能够找出更优的最小约简。通过理论和实例分析说明了算法的有效性。关键词:知识发现;粗糙集:不完备信息系统;数据补齐;知识约简二登茎王塑堡墨箜至塞鱼堕垦竺翌查鲨坚塑Abstrac
4、tIntheprocessofKnowledgeDiscoveryinDatabases,peopleoftenfaceincompleteinformationsystem,thatis,asubstantialproportionofthedatamaybemissinginreal—worldapplications.Itisveryimportanttodealwithincompletedata,becauseitmayleadtoconfusionandirresponsibleoutFlutsindataminning.Asanewmathematicaltoolforde
5、alingwithinexact,uncertaintyorvagueknowledge,theroughsettheoryhasgotgreatSUCCESSinKDDinrecentyears,andthemostprominentadvantageisthat,itneedsonlythedataprovidedintheinformationsystems,relyingonnoothermodelassumptions.Atpresent,thetheoreticalframeofKDDinincompleteinformationsystembasedonroughsetth
6、eoryisbasicllycompleted,butthevarietyandqualityofknowledgeextractedisstillneedtObeimproved.Themainworkofthispaperistogivein-depthstudyontheprocessingmethodofincompletedataproblemusingroughsettheory,tOimprovethequalityandeffiencyofKDD.TherearetWOmethodsofKDDinincompleteinformationsystems:oneistoco
7、mpletetheincompleteinformationsystemfirst,andthenextractknowledgebasedonthecompletedsystem;theotheristoextractknowledgedirectlyfromtheincompleteinformationsystemwithnochangeonoriginalsystem,Thispaperstartswiththistwoki
此文档下载收益归作者所有