基于fp-tree的最大频繁项目集挖掘及更新算法

基于fp-tree的最大频繁项目集挖掘及更新算法

ID:33326605

大小:437.50 KB

页数:7页

时间:2019-02-24

基于fp-tree的最大频繁项目集挖掘及更新算法_第1页
基于fp-tree的最大频繁项目集挖掘及更新算法_第2页
基于fp-tree的最大频繁项目集挖掘及更新算法_第3页
基于fp-tree的最大频繁项目集挖掘及更新算法_第4页
基于fp-tree的最大频繁项目集挖掘及更新算法_第5页
资源描述:

《基于fp-tree的最大频繁项目集挖掘及更新算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、1000-9825/2003/14(09)1586©2003JournalofSoftware软件学报Vol.14,No.9∗基于FP-Tree的最大频繁项目集挖掘及更新算法11,2+11宋余庆,朱玉全,孙志挥,陈耿1(东南大学计算机科学与工程系,江苏南京210096)2(河海大学计算机及信息工程学院,江苏常州213022)AnAlgorithmandItsUpdatingAlgorithmBasedonFP-TreeforMiningMaximumFrequentItemsets11,2+11SONGYu-Qing,ZHUYu-Quan,SUNZhi-H

2、ui,CHENGeng1(DepartmentofComputerScienceandEngineering,SoutheastUniversity,Nanjing210096,China)2(CollegeofComputerandInformationEngineering,HohaiUniversity,Changzhou213022,China)+Correspondingauthor:Phn:86-25-3795451;86-519-5110090,E-mail:yuquanz@sina.comhttp://www.seu.edu.cnRecei

3、ved2002-04-15;Accepted2002-07-02SongYQ,ZhuYQ,SunZH,ChenG.AnalgorithmanditsupdatingalgorithmbasedonFP-treeforminingmaximumfrequentitemsets.JournalofSoftware,2003,14(9):1586~1592.http://www.jos.org.cn/1000-9825/14/1586.htmAbstract:Miningmaximumfrequentitemsetsisakeyprobleminmanydata

4、miningapplication.MostofthepreviousstudiesadoptanApriori-likecandidatesetgeneration-and-testapproach.However,candidatesetgenerationisstillcostly,especiallywhenthereexistprolificpatternsand/orlongpatterns.Inthispaper,afastalgorithmDMFIA(discovermaximumfrequentitemsetsalgorithm)andi

5、tsupdatingalgorithmUMFIA(updatemaximumfrequentitemsetsalgorithm)basedonfrequentpatterntree(FP-tree)forminingmaximumfrequentitemsetsisproposed.ThealgorithmUMFIAmakesuseofpreviousminingresulttocutdownthecostoffindingnewmaximumfrequentitemsetsinanupdateddatabase.Keywords:datamining;m

6、aximumfrequentitemset;associationrule;frequentpatterntree;incrementalupdating摘要:挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discovermaximumfrequentitemsetsalgorithm)及其更新算法UMFIA(updatemaxim

7、umfrequentitemsetsalgorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用.关键词:数据挖掘;最大频繁项目集;关联规则;频繁模式树;增量式更新中图法分类号:TP311文献标识码:A∗SupportedbytheNationalNaturalScienceFoundationofChinaunderGrantNo.79970092(国家自然科学基金);theNationalInnovationFundforSmallTechnology-BasedFirmsofChinaunderGra

8、ntNo.00C26213211014(国家科技型中小企业技术创新

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。