欢迎来到天天文库
浏览记录
ID:33126812
大小:2.70 MB
页数:56页
时间:2019-02-20
《基于fp树的关联规则挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、西安电子科技大学硕士学位论文基于FP树的关联规则挖掘算法研究姓名:委鑫申请学位级别:硕士专业:计算机软件与理论指导教师:祁建军20100501摘要关联规则是数据挖掘领域中的一个非常重要的研究课题,广泛应用于各个领域,既可以检验行业内长期形成的知识模式,也能够发现隐藏的规律。有效地发现、理解、运用关联规则是完成数据挖掘任务的重要手段,因此对关联规则的研究具有重要的理论价值和现实意义。本文深入分析了FP-Growth算法的不足,从数据结构与挖掘方法两个方面进行改进,提出了基于改进FP树的频繁模式挖掘算法。该算法减少了FP树所占用的内存,节省了条件模式树生成所耗的时
2、间。实验表明改进后算法比FP-Growth算法具有更好的性能。然后,在数据库记录增加的情况下,提出了一种高效的最大频繁项目集的增量更新问题。该算法对新增事务处理时,不再向原来FP树子树上增加结点或增加某结点的支持数,而是建立根的新子树或者向新子树上增加结点或增加某结点的支持数。算法只对新增的频繁项目进行处理,对于支持数不变的频繁项目不再进行处理。试验结果表明该算法比同样基于FP树的传统算法挖掘最大频繁项目集的效率更高。关键词:关联规则FP树频繁模式最大频繁项目集增量更新AbstractBeinganextremelyessentialresearchtopic
3、indatamining,associationrulesminingiswidelyappliedinvariousfields.Associationrulesmaybothexaminetheknowledgepatternformedforalongtimeintheprofessionanddiscoverthesecretnewrules.Thediscovery,comprehensionandapplicationofassociationrulesareimportantmeansofaccomplishingthetaskofdatamin
4、ing.Therefore,theresearchofassociationrulesminingisofgreatimportanceinboththeoreticalrealmandrealisticrealm.ThethesisanalysesthedisadvantageofFP-Growthindepth.Takingmeasuresfromdatastructureandminingmeans,anovelalgorithmforminingfrequentpatternsbasedonimprovedcompressedFPtreeispropo
5、sed.ThisalgorithmsaveslargememoryspaceoccupiedbyFPtreeandthecostofconstructingmanyconditionalFPtrees.ExperimentsshowthatthetimeandspacefortheimprovedalgorithmhavereducedsignificantlycomparedtoFP-Growthmining.Then,Increaseinthecaseofdatabaserecords,aMaximumfrequentitem-setsofthemoste
6、fficientincrementalupdateproblem.Inprocessingnewwork.thisalgorithmnolongeraddsnewnodestotheFPtreeorsupportcountofanynode.Insteaditcreatesnewsubtreeofrootoraddsnodestothenewsubtreeoraddssupportcountofanynode.Thisalgorithmonlyhandlesnewlyincreasedfrequentitemsinsteadoffrequentitemswho
7、sesupportcountdosenotchange.TheexperimentresultshowsthatthisalgorithmismoreefficientthanthetraditionalalgorithmbasedonFPtreeforminingmaximumfrequentitem-sets.Keywords:AssociationRulesFPtreeFrequentPatternMaximumfrequentitem-setsIncrementalUpdating西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的
8、科学道德,本人声明所呈交的论文是我个人
此文档下载收益归作者所有