欢迎来到天天文库
浏览记录
ID:33191299
大小:2.71 MB
页数:73页
时间:2019-02-21
《一种改进的关联规则挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、一种改进的关联规则挖掘技术研究专业:计算机应用技术研究方向:数据库应用研究生:丁日新指导教师:陈超泉副教授论文起止日期:2008年9月至2010年4月lIIIIIIIIIIIIIIJlllY1717489AnImprovedTechnologyofAssociationRuleMiningMajor:ComputerApplicationDirectionofStudy:DatabaseApplicationGraduateStudent:DingRixinSupervisor:Prof.ChenChao
2、quanCollegeofInformationScienceandEngineeringScienceGuilinUniversityofTechnologySeptember,2008toApril,2010、卜'研究生学位论文独创性声明和版权使用授权书独创性声明本人声明:所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含他人已经发表或撰写过的研究成果,也不包含为获得其它教育机构的学位或证书而使用过的材料。对论文的完成提供过帮助的有
3、关人员已在论文中作了明确的说明并表示谢意。学位论文作者(签字):签字日期:学位论文版权使用授权书本学位论文作者完全了解(学校)有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的印刷本和电子版本,允许论文被查阅和借阅。本人授权(学校)可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。(保密的学位论文在解密后适用本授权书)本
4、论文是否保密:是否/如需保密,保密期限为:VI.学位论文作者虢mQ耘导师擀碑谊%V签字日期:矽p年/月7日l签字日期:弘佃幸6月7日摘要在信息时代的今天,如何有效地利用大量的原始数据来分析现状以预测未来,已经成为人类面临的一个重大挑战。数据挖掘是致力于数据的分析和理解、发现数据内部蕴含的大量知识技术。目前,数据挖掘已经成为当今学术界的一个研究热点,同时,关联规则挖掘是数据挖掘技术中最活跃的研究方法之一。它是用于发现数据库中不同项目集之间的关系,而怎么快速发现频繁项集是关联规则数据挖掘技术的一个核心问题。如
5、今,关联规则已经被广泛应用于各个领域,但是算法效率不高,并且会产生很多冗余规则,本文针对此问题,根据关联规则挖掘的要求和特点,结合RS理论的属性约简方法和进化算法的思想,提出了一种改进的关联规则挖掘方法,该方法是是把关联规则挖掘过程分成两阶段处理,第一阶段,是利用RS属性约简技术对决策表进行冗余属性约简,第二阶段是对约简后的决策表利用进化算法进行关联规则挖掘。最后通过实例验证改进后的方法具有高实用价值,并且可以很好地解决原始方法中存在的问题。本文的主要工作概括如下:1.对关联规则挖掘技术的定义,性质、挖掘
6、算法、挖掘过程及其研究状况进行介绍,并详细讨论了经典的Apriori算法,和运算过程不产生频繁项集的FP.growth算法。2.提出了一种改进的差别矩阵属性约简算法,其思想是从原始的差别矩阵属性约简方法上进行反思想约简,目的找出对决策影响很小,甚至没有影响的属性,然后删除,较以往的算法意义更加直观,计算也更加简单,并且在一定程度上减低了存储空间要求和提高了约简算法的速度。3.提出了结合RS属性约简方法和遗传算法(GAs)的关联规则挖掘模型,从它的编码方法、适应度函数的构造、遗传算子的设计等方面都进行了详细
7、的讨论和分析。最后,用实验数据证明该方法的可行性、有效性。4.针对传统GAs收敛速度慢和交叉算子和变异算子带来的盲目性和随机性的问题,本文还讨论了一种在GAs基础上发展起来的新型进化优化算法,即分布估计算法(EDAs)。该算法具有良好收敛性能的同时,具有很好的维持群体多样性的能力。并把该算法与RS属性约简方法应用到关联规则挖掘上,取得了很好的效果。关键词:关联规则;属性约简;GAs;EDAsABSTRACTAtinformationage,howtoutilizethehugeoriginaldatato
8、analysisthecurrentsituationandpredictthefutureeffectively,havealreadybecomeagreatchallengethatthemankindhasfaced.DataMining(DM)isatechniquethataimstoanalyzeandunderstandlargesourcedataandrevealknowledgehiddenintheda
此文档下载收益归作者所有