欢迎来到天天文库
浏览记录
ID:33791388
大小:2.29 MB
页数:77页
时间:2019-03-01
《不完备信息系统中数据挖掘的粗糙集方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广西大学硕士学位论文不完备信息系统中数据挖掘的粗糙集方法姓名:梁美莲申请学位级别:硕士专业:计算机应用技术指导教师:梁家荣20050501不完备信息系统中数据挖掘的粗糙集方法摘要数据挖掘中面临大量的不完备信息系统,即可能存在部分对象的一些属性值未知的情况。不完备的数据可能使挖掘过程陷入混乱,导致不可靠的输出。其所表现出来的不确定性也更加显著,这将大大增加数据挖掘的难度。该文以一种处理不精确、不确定和模糊知识的数学方法——粗糙集理论为主要工具,逐步深入展开对不完备信息系统下数据挖掘的研究,以期减少数据挖掘研究与实际应用之间的差距。本文首先详细探讨了与数据不完备
2、性相关的重要问题,并对各种处理属性缺失值的数据挖掘技术进行了归纳总结和分析比较。接着通过对粗糙集理论的研究,阐明了粗糙集理论是一种尤为适用于不确定、不完备系统的数据挖掘的数学工具。其中重点探讨了现有的几个不完备信息系统的粗糙集模型,并对比分析了它们的优缺点。在此基础上,提出了基于容差关系的不完备信息系统中最小决策规则集的提取算法,并通过理论分析、实例和实验说明了该算法的有效性。另外,提出了基于r限制容差关系的不完备信息系统粗糙集模型及其知识约简方法。最后提出了一个基于该数学模型的不完备信息下的数据挖掘系统模型。关键词:数据挖掘粗糙集理论不完备信息系统限制容差
3、关系数据补齐ROUGHSETAPPROACHTOD』UrAMININGININCoMPLETEINFoRMATIoNSYSTEMSABSTRACTMissingorincompletedataareamajorconcernindataminingbothbecauseasubstantialproportionofthedatamaybemissinginreal。worldapplicationsandbecausepoormethodsforincompletedatawillbiastheresultsofdatamining.Inaddition,
4、itisofgreatdifficultyfordatamininginanincompleteinformationsystem,whichcontainsmoreuncertaintythanacompleteonedoes.Thispaperappliesroughsettheory——amathematicaltoolfordealingwithinexact,uncertainorvagueknowledge--tohandlingincompletedataindatamining,SOastoreducethelargegapbetweenth
5、eavailabledataandthemachineryavailabletoprocessthedata.Inthepaper,themainissuesrelatedtotheincompletedataproblemaredetailedfirst.Andthecommonly—usedmethodsofhandlingincompletedataproblemsindataminingarereviewed,withadiscussionaboutanumberoftheirknownstrengthandweakness.Thenthetheor
6、yofroughsetisintroduced.Severalextensionsofroughsetinincompleteinformationsystemarecarefullystudiedandtheperformanceoftheseextendedmodelsarecompared,basedonwhichanalgorithmofoptimaldecisionrulesgenerationispresentedandproved,andanewextensionofsetbasedontheflimitedtolerancerelationa
7、ndknowledgereductionmethodsinitareproposed.Finallyamodelofadataminingsystemunderincompleteinformationisgiven.KEYWORDS:datamining;roughsettheory;incompleteinformationsystem;limitedtolerancerelation;missingdataimputation广西大学硕士掌位论文不完畚信意系统中数据挖掘的粗糙集方法1.1论文的选题背景及意义第一章绪论随着数据库技术的迅速发展以及数据库管
8、理系统的广泛应用,人们积累的数据越来越多。激增的数据
此文档下载收益归作者所有