欢迎来到天天文库
浏览记录
ID:33135907
大小:2.26 MB
页数:67页
时间:2019-02-21
《目标频繁项集挖掘算法与应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广西大学硕士学位论文目标频繁项集挖掘算法与应用研究姓名:梁碧珍申请学位级别:硕士专业:计算机应用技术指导教师:秦亮曦20070603目标频繁项集挖掘算法与应用研究摘要随着信息技术尤其是网络技术的快速发展,人们收集、存储和传输数据的能力不断提高,导致数据出现了爆炸性增长。与此形成鲜明对比的是,对人们决策有价值的知识却非常匮乏。知识发现与数据挖掘正是在这一背景下诞生的--f-j新学科。关联规则是数据挖掘当I;i『研究的主要模式之一,它用于确定数据集中不同域或属性之l'且J的联系,找出有价值的多个域之问的依赖关系。频繁项
2、集挖掘是生成关联规则的关键步骤,其效率J.口J题是关联规则挖掘中的一大难点和热点。频繁项集挖掘可分为完全频繁项集挖掘、频繁闭项集挖掘和最大频繁项集挖掘三类。论文对关联规则的相关定义、频繁项集和最大频繁项集的挖掘方法进行了深入分析和研究。目标频繁项集挖掘足适应用户需要的一种频繁项集挖掘方法。TFP一树能有效过滤与目标模式无关的项和事物,将数据库中完整的、非冗余的信息压缩到一棵树上,使得搜索范围大大缩小;而基于SFP~树的频繁项集挖掘算法是一种较高效的算法,文章的第二部分和第三部分深入讨论了TFP一树和SFP一树结构,
3、以及基于这两种树结构的频繁项集和最大频繁项集的挖掘算法,结合两者的优势,提出一种排序紧缩非冗余树FP一树,简称STFP一树,并提出基于STFP一树目标频繁项集算法STFP-growth和最大目标频繁项集挖掘算法STFP—Max,实验结果表明,算法是较高效的。随着Internet的发展和普及,网络安全问题同益突出,入侵检测是弥补防火墙的不足而提出的安全策略,文章的第四部分对关联规则挖掘算法在入侵检测中的应用进行探索性研究,将提出的目标频繁项集挖掘算法STFP—growth进行扩展,虑用于入侵检测系统,通过KDDcup
4、99实验数据对模型进行评估。关键词:数掘挖掘关联规则频繁项集目标频繁项集STUDYONMININGALGORITHMOFTARGETFREQUENTITEMSETSANDAPPI.ICTIONABSTRACTWiththedevelopmentofinformationtechnology,especiallytheemergingofthenetworktechnology,ourabilitiestocollect,storeandtransferdatahavebeenimproveddramatically
5、Comparingtotheexplosivegrowthofdata,theneedsfordecision-relevantknowledgearenotsatisfiedyet.KnowledgediscoveryanddataminingtechnologyisanimportantapproachtoaddressthisproblemAsoneofthemainpatternsinthefieldofdatamining,associationrulesareusedtodeterminetherela
6、tionshipsamongtheattributesorobjects,tofindoutvaluabledependenciesamongthefields.Theefficiencyofminingfrequentitemsetsisthekeyprobleminassociationrulesgenerating.Frequentitemsetscanbedividedintothreetypes:complete,closedandmaximal.Thisdissertationstudiedthorou
7、ghlytherelateddefines,theminingmethodsofcompleteandmaximalfrequentitemsets.Targetfrequentitemsetsminingalgorithmsareasortofthatsatisfiedtheusers.TFP—treecanfiltertheitemsandtransactionswhichdon’tcontributetotargetpattem,andcompresstheintegrityalgorithmsandno·r
8、edundantdataofthedatabaseintoatree,SOitcangreatlyreducethehuntingrange.AndthealgorithmsbaseonSFP—treearehighperformancesforminingfrequentpatternsInthesecondandthethirdofthepaper,we
此文档下载收益归作者所有