欢迎来到天天文库
浏览记录
ID:33905205
大小:4.41 MB
页数:63页
时间:2019-03-01
《基于集合枚举树的关联规则挖掘算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、独创性声明本人所呈交的学位论文是在导师指导下进行的研究工作及取得的成果。尽我所知,除特{l,J/Jt{以标注的地方外,论文中不包含其他人的研究成果。与我一同工作的同志对本文的研究工作和成果的任何贡献均已在论文中作了明确的说明并已致谢。本论文及其相关资料若有不实之处,由本人承担一切相关责任。论文作者签名:互逃沙f弓年争月z/日学位论文使用授权本人作为学位论文作者了解并愿意遵守学校有关保留、使用学位论文的规定,即:在导师指导下创作完成的学位论文的知识产权归西安理工大学所有,本人今后在使用或发表该论文涉及的研究内容时,会注明西安理工大学。
2、西安理工大学拥有学位论文的如下使用权,包括:学校可以保存学位论文;可以采用影印、缩印或其他复制手段保存论文;可以查阅或借阅。本人授权西安理工大学对学位论文全部内容编入公开的数据库进行检索。本学位论文全部或部分内容的公布(包括刊登)授权西安理工大学研究生学院办理。经过学校保密办公室确定密级的涉密学位论文,按照相关保密规定执行;需要进行技术保密的学位论文,按照《西安理工大学学位论文技术保密申请表》内容进行保密(附《西安理工大学学位论文技术保密申请表》)。保密的学位论文在解密后,适用本授权。论文作者签名:幺亟丛&导师签名:沙l弓年眵月2-
3、Ft摘要论文题目:基于集合枚举树的关联规则挖掘算法学科专业:计算机应用技术研究生:张玉冰签名:指导教师:姚全珠教授签名:摘要数据挖掘技术是当今处理“数据爆炸、知识贫乏”的一种行之有效的方式,而关联规则又是数据挖掘的一个重要的研究方向,它描述了两个或多个事物之间的相互依存关系,实际上是描述两个或多个变量之间的某种潜在关系的特征规则。其挖掘的时空效率成为了人们广泛关注的问题,研究者们在如何降低算法的复杂性、提高挖掘效率方面做出了大量的研究。而频繁项集的挖掘又是关联规则挖掘中的重中之重,所以大量的研究都围绕这一步骤进行展开。本文首先对数据
4、挖掘及关联规则挖掘进行了综述,概述了数据挖掘的发展过程及广泛的应用领域,总结了数据挖掘的步骤、任务及方法,并列出了关联规则挖掘的国I为#1-研究现状及研究热点,同时描述了关联规则的基本理论及频繁项集挖掘的三种主要分类方法。然后基于集合枚举树的概念框架,提出了以下两个算法。一方面,在经典关联规则算法的基础上,提出了一种基于CBD树的频繁项集挖掘算法,克服了一些经典算法的不足,利用垂直位向量及其数量积并且采用宽度优先与深度优先相结合的策略,通过有效的剪枝方式获得频繁项集,提高了算法的挖掘效率。另一方面,在传统数据集挖掘最大频繁项集的基础
5、上,提出一种适用于不确定数据的最大频繁项集挖掘算法,此算法克服了先前在不确定数据中挖掘完全频繁项集效率较低的问题,使用概率矩阵及深度优先搜索方式挖掘不确定数据中的最大频繁项集,并且利用四种剪枝策略,提高了算法的效率。最后,通过实验分别验证了两种算法的有效性,证明本文提出的算法具有一定的实用价值。关键词:关联规则;频繁项集;集合枚举树;不确定数据AbstractTitle:ASSOClATlONRULESMINlNGALGORITHMBASEDONSET.ENUMERATIONTREEMajor:ComputerApplication
6、TechnologyName:YubingZHANGSupervisor:Prof.QuanzhuYAOSignature:一Now,thetechnologyofdataminingisaneffectivewaytodealwith‘'theexplosionofthedata,andthelackoftheknowledge”,andassociationruleisanimportantresearchdirectionofdatamining.Associationruledescribesthemutualdepende
7、ncerelationshipoftwoormorethings,infact,whichdescribesthecharacteristicsrulesofapotentialrelationshipbetweentwoormorevariables.Thespaceandtimeefficiencyofminingbecomesaproblemwhichiswidelyconcernedbypeople,andtheresearchershavemadenumbersofresearchesonhowtoreducethecom
8、plexityofthealgorithmandimprovetheefficiencyofmining.Miningfrequentitemsetsisthemostimportantstepofassociationrulemin
此文档下载收益归作者所有