基于模糊理论的数据挖掘技术的研究与应用

基于模糊理论的数据挖掘技术的研究与应用

ID:35152168

大小:1.73 MB

页数:58页

时间:2019-03-20

基于模糊理论的数据挖掘技术的研究与应用_第1页
基于模糊理论的数据挖掘技术的研究与应用_第2页
基于模糊理论的数据挖掘技术的研究与应用_第3页
基于模糊理论的数据挖掘技术的研究与应用_第4页
基于模糊理论的数据挖掘技术的研究与应用_第5页
资源描述:

《基于模糊理论的数据挖掘技术的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、南京航空航天大学硕士学位论文基于模糊理论的数据挖掘技术的研究与应用姓名:皋军申请学位级别:硕士专业:计算机软件与理论指导教师:王建东20040201南京航夺航天学明f:学位论文摘要本文通过对数据挖掘技术方法的研究,并充分考虑挖掘过程中模糊性,对经典的挖掘技术加以模糊处理,体现了现实世界中事物特性的不确定性和模糊性。从而在经典挖掘方法的基础上,提出了连续属性模糊离散化方法、模糊属性的相对近似约减方法、模糊关联规则挖掘方法。通过对上述方法的测试体现了方法的有效性、可行性,并能充分说明现实世界中事物具有模糊特性,对处理具体问题有指导作用。关

2、键词:数据挖掘;模糊集;离散化;约筒;关联规则竺±丝塑型堡塑塑塑丝塑垫查堕竺茎』堂旦—————————————一AbstractBvstudyingthealgorithmsofdata—miningtechnologyandtakingfullconsiderationofthefuzzyfeatureintheprocessofdata—mining,itmakestheclassicminingtechnologyfuzzyinordertoshowtheinexactnessandtheambiguityofthingsint

3、herealworld.Also,ItproducesanalgorithmofcontinuOUS—valuedattributefuzzydiscretization,analgorithmofaoproximatereductionaboutfuzzyattributeandanalgorithmofminingaboutfuzzy—associationrulesbasedontheclassicalgorithmsofmining.Thetestingoftheabovealgorithmsshowthattheyarepr

4、acticalandfeasibleandthatthingsintherealworldarefuzzy.TheycanheusedtodireetUStodealwithcertainproblems.Keywords:datamining:fuzzyset;discretization:reductiomassociationrtliesll塑塞塾!堕墨兰竺!!兰垡兰苎一1.1引言第一章绪论在当今的信息社会,随着各种信息数据量的增加,特别是因为网络技术的发展,使得数据成海量形式的递增,现有数据库的存储、处理技术难以满足信息化社会

5、的要求。人们已经不满足于对这些数据进行查询、检索、简单的算术运算,而是迫切需要将这些数据转换成有用的信息和知识。比如:对于一个大型的超市,它每天都产生大量的顾客购物的数据,而作为超市的管理人员往往面对这么多的数据显得束手无策,不知道怎么处理和分析这些数据并从中得到有益的知识。为了克服这种“数据丰富,但信息贫乏’,163】的局面,人们对能够处理和分析这些数据的技术、工具需求显得更加强烈。于是数据挖掘(DataMining)技术应运而生。近年来,计算机硬件稳定的、令人吃惊的进步导致了功能强大的计算机、数据收集设备和存储介质的大量供应。这些

6、技术大大推动了数据库技术,使得大量数据库和信息存储用于事务管理、信息检索和数据分析,从而使得数据挖掘技术能在信息产业界得到极大关注和发展。然而数据挖掘技术主要原因是存在大量的数据,运用挖掘技术、工具可以从大量的数据中提炼出有用的信息一一知识。从知识这个角度来看,专家系统的研究虽然取得了一定的进展,但是。知识的获取只能从领域专家处得到,这是专家系统研究中的瓶颈。而数据挖掘技术可以动态的、无指导的从原始数据集中提取领域的知识。1.2数据挖掘概述1.2.1数据挖掘的定义许多人把数据挖掘视为“数据库中的知识发现”或“KDD”的同义词,丽另一部

7、分人只是把数据挖掘看作知识发现过程的一个基本的步骤。本文赞同后~个观点,于是给出如下的定义鸭数据挖掘:是从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘有趣知识的过程。1.2.2数据挖掘系统的主要成分(1)数据库、数据仓库或其他信息库皋十模丰5

8、I挫论的数据挖掘技术的研究’i心用这是~组或多组数据库、数据仓库、电子表格或其他类型的信息库。可以在原始数据集上进行数掘清理和集成。(2)数据库和数据仓库服务器根据用户的数据挖掘的请求,数据库或数据仓库服务器负责提取相关数据。(3)知识库这是领域知识,用于指导搜索,或评估结果模式的兴趣度

9、。这种知识包括“概念分层”、用户确信的知识、闽值、元数据。(4)数掘挖掘引擎这是数据挖掘系统基本的部分,出一组功能模块组成,用于特征化、关联、分类、聚类分析以及演变和偏差分析。(5)模式评估模块通常此成分使用兴趣度度量来

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。