关联规则的相关算法研究-基于apriori和_fp-growth算法

关联规则的相关算法研究-基于apriori和_fp-growth算法

ID:6803584

大小:436.00 KB

页数:56页

时间:2018-01-26

关联规则的相关算法研究-基于apriori和_fp-growth算法_第1页
关联规则的相关算法研究-基于apriori和_fp-growth算法_第2页
关联规则的相关算法研究-基于apriori和_fp-growth算法_第3页
关联规则的相关算法研究-基于apriori和_fp-growth算法_第4页
关联规则的相关算法研究-基于apriori和_fp-growth算法_第5页
资源描述:

《关联规则的相关算法研究-基于apriori和_fp-growth算法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、学校代码:10491研究生学号:中国地质大学硕士学位论文关联规则的相关算法研究-基于Apriori和FP-growth算法硕士生:学科专业:计算机软件与理论指导教师:二○一○年五月学校代码:10491研究生学号:中国地质大学硕士学位论文关联规则的相关算法研究-基于Apriori和FP-growth算法硕士生:学科专业:计算机软件与理论指导教师:二○一○年五月学校代码:10491研究生学号:中国地质大学硕士学位论文关联规则的相关算法研究-基于Apriori和FP-growth算法硕士生:学科专业:计算机软件与理论指导教师:二○一○年五月学校代码

2、:10491研究生学号:中国地质大学硕士学位论文关联规则的相关算法研究-基于Apriori和FP-growth算法硕士生:学科专业:计算机软件与理论指导教师:二○一○年五月ADissertationSubmittedtoChinaUniversityofGeosciencesfortheMasterDegreeofComputerSoftwareandTheoryResearchonAssociationRulesMiningAlgorithm-baseonAprioriandFP-growthMasterCandidate:LIANGWei

3、Major:ComputerSoftwareandTheorySupervisor:SUNBinChinaUniversityofGeosciencesWuhanP.R.China中国地质大学(武汉)研究生学位论文原创性声明本人郑重声明:本人所呈交的硕士学位论文《关联规则的相关算法研究-基于Apriori和FP-growth算法》,是本人在导师的指导下,在中国地质大学(武汉)攻读硕士学位期间独立进行研究工作所取得的成果。论文中除已注明部分外不包含他人已发表或撰写过的研究成果,对论文的完成提供过帮助的有关人员已在文中说明并致以谢意。本人所呈交的

4、硕士学位论文没有违反学术道德和学术规范,没有侵权行为,并愿意承担由此而产生的法律责任和法律后果。学位论文作者(签字):日期:  年  月  日作者简介梁伟,男,壮族,1976年1月出生于广西壮族自治区崇左市。2008年9月进入中国地质大学(武汉)信息工程学院攻读硕士学位,专业为计算机软件与理论,研究方向为数据库技术和数据挖掘。至今已经修完全部课程,共计15门课程,其中学位课程10门,选修课程5门,各门课程成绩合格,总学分为28分,各科平均成绩为72分。在硕士研究生学习阶段,认真学习专业知识,阅读大量专业文献,以第一作者在公开刊物发表论文两篇:

5、△《关联规则算法探讨》-企业技术开发(CN43-1172/TB,2009.10)△《基于MYSQL的SQL注入问题研究》-科教导刊(CN42-1795/N,2009.12)关联规则的相关算法研究-基于Apriori和FP-growth算法硕士生:梁伟导师:孙斌摘要数据挖掘是当今人工智能和数据库研究方面最富活力的领域。数据挖掘是指从大量的数据中发现潜在的、有用的知识的过程。关联规则数据挖掘是数据挖掘的一个主要研究内容,而如何快速发现频繁项集是关联规则数据挖掘算法的核心问题。本文讨论了数据挖掘和关联规则的一般理论,包括数据挖掘的概念、任务、模式以

6、及数据挖掘的应用和发展趋势。深入研究了关联规则挖掘算法,分析了关联规则挖掘中经典的Apriori和FP-growth算法,并总结了Apriori和FP-growth算法中存在的问题。针对Apriori算法的效率问题,从两个角度进行改进:(1)降低候选项目集中候选项产生的数量;(2)减少扫描数据库的次数。给出了一种较为高效的关联规则挖掘算法。算法的主要思想是在扫描数据库的同时把支持每个项目的事务都标记出来,采用一种新的方法生成所有的频繁集。该算法只需对源数据库进行一次扫描就可以找出所有的频繁集,并通过裁剪候选集的方法达到减少候选项数目集的目的。

7、这样做不但降低了算法的I/O负荷,而且减少了时间开销,具有很高的效率。最后,将基于关联规则的数据挖掘改进算法方法应用到学生考试成绩管理中,对挖掘结果进行了分析,并提出了指导意见。本文的工作虽然取得了一定的成果,但尚有大量问题有待于进一步研究,比如,关联规则挖掘应用系统的设计;关联规则有趣度的研究以及如何将挖掘结果友好地呈现给用户。关键词:数据挖掘关联规则频繁集支持度可信度ResearchonAssociationRulesMiningAlgorithm-baseonAprioriandFP-growthMasterCandidate:LIAN

8、GWeiSupervisor:SUNBinABSTRACTDataMiningisoneofthemostactiveresearchfields,especial

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。