基于fp树的关联规则挖掘算法研究

基于fp树的关联规则挖掘算法研究

ID:33126812

大小:2.70 MB

页数:56页

时间:2019-02-20

基于fp树的关联规则挖掘算法研究_第1页
基于fp树的关联规则挖掘算法研究_第2页
基于fp树的关联规则挖掘算法研究_第3页
基于fp树的关联规则挖掘算法研究_第4页
基于fp树的关联规则挖掘算法研究_第5页
资源描述:

《基于fp树的关联规则挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西安电子科技大学硕士学位论文基于FP树的关联规则挖掘算法研究姓名:委鑫申请学位级别:硕士专业:计算机软件与理论指导教师:祁建军20100501摘要关联规则是数据挖掘领域中的一个非常重要的研究课题,广泛应用于各个领域,既可以检验行业内长期形成的知识模式,也能够发现隐藏的规律。有效地发现、理解、运用关联规则是完成数据挖掘任务的重要手段,因此对关联规则的研究具有重要的理论价值和现实意义。本文深入分析了FP-Growth算法的不足,从数据结构与挖掘方法两个方面进行改进,提出了基于改进FP树的频繁模式挖掘算法。该算法减少了FP树所占用的内存,节省了条件模式树生成所耗的时

2、间。实验表明改进后算法比FP-Growth算法具有更好的性能。然后,在数据库记录增加的情况下,提出了一种高效的最大频繁项目集的增量更新问题。该算法对新增事务处理时,不再向原来FP树子树上增加结点或增加某结点的支持数,而是建立根的新子树或者向新子树上增加结点或增加某结点的支持数。算法只对新增的频繁项目进行处理,对于支持数不变的频繁项目不再进行处理。试验结果表明该算法比同样基于FP树的传统算法挖掘最大频繁项目集的效率更高。关键词:关联规则FP树频繁模式最大频繁项目集增量更新AbstractBeinganextremelyessentialresearchtopic

3、indatamining,associationrulesminingiswidelyappliedinvariousfields.Associationrulesmaybothexaminetheknowledgepatternformedforalongtimeintheprofessionanddiscoverthesecretnewrules.Thediscovery,comprehensionandapplicationofassociationrulesareimportantmeansofaccomplishingthetaskofdatamin

4、ing.Therefore,theresearchofassociationrulesminingisofgreatimportanceinboththeoreticalrealmandrealisticrealm.ThethesisanalysesthedisadvantageofFP-Growthindepth.Takingmeasuresfromdatastructureandminingmeans,anovelalgorithmforminingfrequentpatternsbasedonimprovedcompressedFPtreeispropo

5、sed.ThisalgorithmsaveslargememoryspaceoccupiedbyFPtreeandthecostofconstructingmanyconditionalFPtrees.ExperimentsshowthatthetimeandspacefortheimprovedalgorithmhavereducedsignificantlycomparedtoFP-Growthmining.Then,Increaseinthecaseofdatabaserecords,aMaximumfrequentitem-setsofthemoste

6、fficientincrementalupdateproblem.Inprocessingnewwork.thisalgorithmnolongeraddsnewnodestotheFPtreeorsupportcountofanynode.Insteaditcreatesnewsubtreeofrootoraddsnodestothenewsubtreeoraddssupportcountofanynode.Thisalgorithmonlyhandlesnewlyincreasedfrequentitemsinsteadoffrequentitemswho

7、sesupportcountdosenotchange.TheexperimentresultshowsthatthisalgorithmismoreefficientthanthetraditionalalgorithmbasedonFPtreeforminingmaximumfrequentitem-sets.Keywords:AssociationRulesFPtreeFrequentPatternMaximumfrequentitem-setsIncrementalUpdating西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的

8、科学道德,本人声明所呈交的论文是我个人

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。