基于fp树关联规则算法改进的研究

基于fp树关联规则算法改进的研究

ID:20651728

大小:635.00 KB

页数:45页

时间:2018-10-14

基于fp树关联规则算法改进的研究_第1页
基于fp树关联规则算法改进的研究_第2页
基于fp树关联规则算法改进的研究_第3页
基于fp树关联规则算法改进的研究_第4页
基于fp树关联规则算法改进的研究_第5页
资源描述:

《基于fp树关联规则算法改进的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要数据挖掘是从海量数据中发现蕴含其中的有用信息和知识的过程,应用广泛。关联规则分析作为数据挖掘的主要功能之一得到了广泛应用,对关联规则算法的深入研究具有很高的理论价值和现实意义。本文首先阐述了数据挖掘的相关知识,对关联规则经典算法Apriori算法和FP-growth算法作出详细介绍,分析并指出了这些经典算法存在的问题与不足。虽然基于FP-Tree的经典FP-growth算法不需要像Apriori算法一样产生大量的候选频繁项集,但必须进行大量的遍历和递归操作,严重影响了挖掘的整体效率。针对FP-growth算法在构建FP-Tree和挖掘频繁项集

2、两方面存在的缺陷,本文提出了DFP-Tree构造和FP-数组技术来提高算法的效率,结合两种技术提出DFPmine算法,并通过实验证明了算法的效率。实验结果表明,DFPmine算法比FP-growth算法来的更有效率,尤其是在数据集比较大且比较稀疏,关联聚集度较低,FP-Tree分支较多的情况下,本算法效果明显,比经典FP-growth算法能获得更好的性能。关键字:关联规则;FP-Tree;FP-growthIAbstractDataminingistheprocessoffindingtheusefulinformationandknowledg

3、einthehugeamountsofdataforpeople,appliedwidely.Associationrulesasastrongfunctionofdatamining,researchonwhichhasahightheoreticalvalueandpraticalsignificance.Thisarticlefirstlydescribesthedataminingknowledgebriefly,givesdetaileddescriptionoftheclassicassociationrulesalgorithmss

4、uchasApriorialgorithmandFP-growthalgorithm,illustratesandpointsouttheshortcomings.AlthoughtheclassicFPalgorithm,basedontheFP-Tree,doesnotneedtocreatealargenumberofcandidatefrequentitemsetsastheApriorialgorithm,itneedsalargenumberoftraversalandrecursionoperations,whichreducest

5、heefficiencygreatly.ToovercomethedefectsoftheFP-growthalgorithminbuildingtheFP-Treeandminingfrequentitemsets,anewstructureofDFP-TreeandFP-arraytechnologyareproposedtoimprovetheefficiencyofthealgorithm.Basedonthem,DFPminealgorithmisproposed.Then,doexperimentstoprovetheefficien

6、cyofthealgorithm.TheexperimentsshowthattheDFPminealgorithmismoreefficientthantheFP-growthalgorithm,inparticular,itismoreeffectiveandhasbetterperformancethantheclassicFP-growthalgorithmwhenthedatasetsarerelativelylargeandsparse,theassociationaggregationdegreeislow,ortheFP-Tree

7、hasagreatnumberofbranches.Keywords:associationrules;FP-Tree;FP-growthII目录摘要..............................................................................................................................IAbstract..................................................................

8、......................................................II目录..........

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。