粗糙集理论及其在数据预处理中的应用

粗糙集理论及其在数据预处理中的应用

ID:36799192

大小:1.52 MB

页数:57页

时间:2019-05-15

粗糙集理论及其在数据预处理中的应用_第1页
粗糙集理论及其在数据预处理中的应用_第2页
粗糙集理论及其在数据预处理中的应用_第3页
粗糙集理论及其在数据预处理中的应用_第4页
粗糙集理论及其在数据预处理中的应用_第5页
资源描述:

《粗糙集理论及其在数据预处理中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要随着数据库技术的迅猛发展,人们可以轻易的获得海量的数据,并且这些数据还在日益增长,我们希望计算机能够自动的帮助我们处理这些海量的数据,并提取隐含的有价值的知识,这就需要我们对数据库知识的发现作更加深入地研究。换句话说,知识发现就是从某个领域的历史数据中获取有用的、未知的知识,由于历史数据在设计时并没有考虑数据挖掘任务或者考虑较少,且历史数据有时存储在多个数据库中,并且数据库中数据的不完全性是不可避免的。从这些数据库中收集而成的样本数据集并不一定适合直接用于数据挖掘,通常需要经过预处理后才能使用。而粗糙集理论是一种新的处理模糊、不精确、不完全数据的数学工具。它是建立在

2、分类机制的基础上,将分类理解为特定空间上的等价关系,而等价关系构成了对该空间的划分;粗糙集理论的主要思想是在保持原来信息系统分类能力不变的前提下,利用已知的知识库,将不精确或者是不确定的知识用知识库中已知的知识来近似刻画,通过知识的补充、约简,导出问题的决策或者分类规则。粗糙集理论自从粗糙集在八十年代提出之后,已经成功的运用于许多商业应用中,因而粗糙集理论引起了众多研究者的兴趣。本文主要是在广州三汽公司信息管理系统的项目背景下讨论了粗糙集理论及其在数据预处理中的应用问题。本文首先介绍了数据预处理技术和几种处理方法;然后分析了粗糙集的基本理论,并且介绍了基于不完备信息系统

3、的粗糙集理论;然后我们重点介绍和分析了缺损数据的补全问题,并分析了填补算法,最后结合实际情况分析了ROUSTIDA算法在广州第三公交汽车公司收费系统中对数据进行纠错处理过程中的应用情况,并对结果作出了分析。关键字:粗糙集数据预处理信息系统缺损数据华南理:I:大学1j程硕士学位论文曼!曼曼苎曼曼曼!!!!皇!!皇!!!皇!曼皇!曼曼!!!曼曼!曼曼曼曼曼曼曼曼曼墨詈曼曼!鼍皇皇!曼曼曼曼!量曼曼曼曼!!曼AbStractWiththerapiddevelopmentofdatabasetechnology,peol,lccangetGBsorTBsdataeasily.T

4、heamountofdataisincreasingfast;uehopetodealwiththesedatabytheaidofcomputersandtoUUVeivaluableinformationfromthesedata.That’Swhyweneedtomakeafurtl'

5、crresearchinknowledgediscoveryofdatabase。Shortlytosay,knowledgediscoveryistOfindusableai.。、.aknowninformationfromonedomain’Shistoricaldata.Bu

6、twhenthesedatabasewhichstoredhistoricaldatawasdesigned,thedesignerUsnal1ythoughtlittleaboutfuture’susagefordatamining,orevennone.Andj11facl,thesehistoricaldataoftenstoredinadistributedenvironmentwhichlcadstomuchinconsistentdata.Datasetssampledfromthiskindofdatastoreenvironmentcannotmeett

7、herequirementsfordirectdatamininS.Sosomeproceduresmustbedonebeforefurtherprocessingwiththesedata,suchasdataminingandknowledgediscovery.Theroughsettheoryisanewlymathematictooltodealwithinaccurateandincompletedata.1ffoundOilsortingmechanism.Sortingisanequalrelationinaspecificspace.Andtheeq

8、ualrelationdividesthespace.Roughsettheoryusekno、、’1cdgefromknownrepositoriestodescripttheuncertainandinaccuratek】一、.:edgeofunknownrepositoriesapproximately,andkeepthesortingabilit?oforiginalinformationsystemunchanged.Thenwithcomplementarifiesandpredigestionsofthesedata,it

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。