欢迎来到天天文库
浏览记录
ID:36517637
大小:2.19 MB
页数:55页
时间:2019-05-11
《正负关联规则中冗余规则修剪技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、山东轻T业学院硕十学位论文摘要关联规则挖掘已经成为数据挖掘领域重要的研究方向之一。然而传统算法生成的关联规则之间存在着大量的冗余规则,这使得用户分析和利用这些规则变得十分困难。为了帮助用户分析,可以采用各种技术有效地减少大量的冗余规则。目前,关于正关联规则中冗余规则删剪技术的研究颇多,已经提出了多种冗余规则删剪的算法。本文总结了在正负关联规则中经常出现的几种冗余规则,并对它们进行了讨论和分析。针对这些冗余规则,本文采取了相应的方法对其进行了修剪。(1)在已有算法的基础上提出了一种改进的冗余规则修剪方法。该方法引入相关性这一概念,提出并证明了
2、一个重要定理:若彳jBC是一条有效的关联规则,则彳=>B(或么jC)也是一条有效的正关联规则,当且仅当corrA.B>I(COFFA.c>1)。这一定理说明了只有当corrA.口>1(CO?'FA,C>1)时,规则彳≥B(或彳jC)才能相对于4jBC是冗余的,否则,彳jB(或彳≥C)可能都不是一条有效的关联规则。本文根据这一定理提出了一种改进的冗余规则修剪方法,实验结果证明它能够明显地减少关联规则的数量,是有效的。(2)对PNARC算法挖掘出的负关联规则进行分析,发现其中存在了大量的冗余规则。本文只对三种典型的冗余负关联规则进行了讨论,①一
3、彳j—B—C,②-'AjBC,③一么j—BC。因为与其他类型的负关联规则比较,相对于这三种负关联规则的冗余规则数量是比较多的。所以本文通过分析得出了三个重要的推论并给出了证明。实验证明这一方法在一定程度上删除了其中的冗余规则。关键词:数据挖掘;关联规则;相关性;冗余性;修剪nIABSTRACTABSTRACTAssociationrulemimngisoneofthemostimportanttechniquesofdatamining.Butthetraditionalassociationrulesdiscoveryalgorithmp
4、roducestoomanyredundantrules,whichmakesitdifficultforuserstoanalyzeandmakesuseoftheserules.Tofacilitateanalysis,thenumberofredundantrulesCanbereducedsignificantlybytechniques.Atpresent,manyresearchershaveproposedsomenon-redundantrulesalgorithm.Inthispaper,somearisenredunda
5、ntrulesissummarizedanddiscussed.Thispapertakescorrespondingmethodtoprunetheseredundantrules.(1)Animprovednon—redundantrulesmethodispresentedbasedonformeralgorithm.Themethodshowsanimportanttheoremthroughintroducingcorrelation.If么jBCisaneffectiveassociationrule,then4≥B(or彳≥C
6、)isaneffectiveassociationruleiffcorrA,B>I(corrA,c>1).Thistheormexplainsthat彳jB(or彳≥C)isredundantfor彳=>BCnootherthancorrA。矿1(corrA.c>1).Otherwise,么jB(or么≥C)isnotaneffectiverule.Thispaperpresentsanimprovednon-redundantrulesmethodbasedonthistheorem.Theexperimentsshowthatthism
7、ethodcanreducethenumberofassociationruleseffectively.(2)NegtiveassociationrulesminedbyPNARCisanalyzedinthispaper,wefoundmanyredundantrules.Thispaperonlydiscussesthreekindoftypicalnegtiveassociationrules,①_1彳j—B-]e②.1彳jBC,③_14j-1BC.Becausethesethreekindofrulesmakemoreredund
8、antrulesforthem.Therefore,thispapereducedthreeimportantdeduceandprovedthem.Theexperiments
此文档下载收益归作者所有