资源描述:
《基于fp-tree的最大频繁项目集挖掘及更新算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、1000-9825/2003/14(09)1586©2003JournalofSoftware软件学报Vol.14,No.9∗基于FP-Tree的最大频繁项目集挖掘及更新算法11,2+11宋余庆,朱玉全,孙志挥,陈耿1(东南大学计算机科学与工程系,江苏南京210096)2(河海大学计算机及信息工程学院,江苏常州213022)AnAlgorithmandItsUpdatingAlgorithmBasedonFP-TreeforMiningMaximumFrequentItemsets11,2+11SONGYu-Qing,ZHUYu-Quan,SUNZhi-H
2、ui,CHENGeng1(DepartmentofComputerScienceandEngineering,SoutheastUniversity,Nanjing210096,China)2(CollegeofComputerandInformationEngineering,HohaiUniversity,Changzhou213022,China)+Correspondingauthor:Phn:86-25-3795451;86-519-5110090,E-mail:yuquanz@sina.comhttp://www.seu.edu.cnRecei
3、ved2002-04-15;Accepted2002-07-02SongYQ,ZhuYQ,SunZH,ChenG.AnalgorithmanditsupdatingalgorithmbasedonFP-treeforminingmaximumfrequentitemsets.JournalofSoftware,2003,14(9):1586~1592.http://www.jos.org.cn/1000-9825/14/1586.htmAbstract:Miningmaximumfrequentitemsetsisakeyprobleminmanydata
4、miningapplication.MostofthepreviousstudiesadoptanApriori-likecandidatesetgeneration-and-testapproach.However,candidatesetgenerationisstillcostly,especiallywhenthereexistprolificpatternsand/orlongpatterns.Inthispaper,afastalgorithmDMFIA(discovermaximumfrequentitemsetsalgorithm)andi
5、tsupdatingalgorithmUMFIA(updatemaximumfrequentitemsetsalgorithm)basedonfrequentpatterntree(FP-tree)forminingmaximumfrequentitemsetsisproposed.ThealgorithmUMFIAmakesuseofpreviousminingresulttocutdownthecostoffindingnewmaximumfrequentitemsetsinanupdateddatabase.Keywords:datamining;m
6、aximumfrequentitemset;associationrule;frequentpatterntree;incrementalupdating摘要:挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discovermaximumfrequentitemsetsalgorithm)及其更新算法UMFIA(updatemaxim
7、umfrequentitemsetsalgorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用.关键词:数据挖掘;最大频繁项目集;关联规则;频繁模式树;增量式更新中图法分类号:TP311文献标识码:A∗SupportedbytheNationalNaturalScienceFoundationofChinaunderGrantNo.79970092(国家自然科学基金);theNationalInnovationFundforSmallTechnology-BasedFirmsofChinaunderGra
8、ntNo.00C26213211014(国家科技型中小企业技术创新