基于多维谓词索引树的关联规则挖掘算法的研究与应用

基于多维谓词索引树的关联规则挖掘算法的研究与应用

ID:33101684

大小:3.85 MB

页数:65页

时间:2019-02-20

基于多维谓词索引树的关联规则挖掘算法的研究与应用_第1页
基于多维谓词索引树的关联规则挖掘算法的研究与应用_第2页
基于多维谓词索引树的关联规则挖掘算法的研究与应用_第3页
基于多维谓词索引树的关联规则挖掘算法的研究与应用_第4页
基于多维谓词索引树的关联规则挖掘算法的研究与应用_第5页
资源描述:

《基于多维谓词索引树的关联规则挖掘算法的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、湖南大学硕士学位论文基于多维谓词索引树的关联规则挖掘算法的研究与应用姓名:彭硕申请学位级别:硕士专业:计算机应用技术指导教师:吴昊20100426基丁.多维谓词索引树的关联舰91q挖掘算法的研究’j应用摘要关联规贝0挖掘作为数据挖掘中的一个重要问题,已经广泛地应用于各人商业领域,成为数据挖掘巾最主要的研究内容之一。多维关联规则作为关联规则的一种重要形式,在近年来也得到了迅速的发展,成为近几年来一个研究热点。首先,本文分析了目前研究多维关联规则挖掘的两种主要途径,一种是扩展维内关联挖掘算法直接应用于多维事务数据库产生多维关联规则,此方法具有很好的灵活性,但处理维谓词的I/O开销较大,从整体上来

2、说效率较低。另一种是利用数据立方体技术进行多维关联规则挖掘,此方法具有较好的I/O性能,特别当数据立方体较小时,可以用多维数组有效实现,然而针对维数较多的大型数据库,构造及维护相应的数据立方体是极其昂贵的。然后,针对两类方法的优缺点,提出了一种高效的多维关联规则算法,通过引入一种新的数据结构一一MDPI.tree(Multi.dimensionalPredicateIndexTree)结构,有效地将数据立方体技术和频繁项集挖掘技术结合起来,其中MDPI.tree由维信息部分的DP—tree(DimensioalPredicateTree)和项信息部分事务构造的FP—tree(Frequent

3、PatternTree)及其连接构造而成。算法采取分而治之的思想,首先对维信息部分构建数据立方体,并采用致密的前缀树结构DP.tree压缩存储,最大限度的压缩存储空间;然后对项信息部分,采用FP—Growth算法挖掘频繁维谓词约束下的频繁项集,从而大大减少了项信息的处理量。该算法既利用了数据立方体能够有效处理多维数值度量的优点,又高效地处理了事务的项信息,不仅能够挖掘维间关联规则,而且能够挖掘混合维关联规则。最后,本文以vc++6.0,sqlserver2000为实验平台,通过实验验证了MDPI算法的性能,实验结果表明MDPI算法不仅具有良好的I/O性能,还具有很好的伸缩性与稳定性。并将基于

4、MDPI的多维关联规则算法应用于某移动通信公司交叉销售中,结果显示所挖掘出的多维关联规则具有一定的商业价值,能为决策分析人员提供决策依据。关键词:数据挖掘;多维关联规则;频繁项集;数据立方体;多维谓词索引树Ⅱ硕士学位论文AbstractMiningassociationrulesindataminingasanimportantissue,hasbeenwidelyusedinmajorcommercialareaswhichmakesitbecomeoneofthemostmatureandimportantresearchindatamining.Multidimensionalasso

5、ciationrulesasanimportantformofassociationrules,hasalsobeenrapidlydevelopedintoaresearchhotspotinrecentyears..Firstofall,thispaperanalyzestwomainwaystostudythecurrentmulti—dimensionalassociationrulemining,oneistOextendtheassociationminingalgorithms,SOitcandirectlyappliedtomulti-dimensionaldatabasea

6、ndderivedfrommulti—dimensionalassociationrules,whichhasgoodscalabilityandcapableofhandlinglargeamountsofdata,butitcostsmuchaboutI/Oforhandlingofthepredicate—dimensional.Sothismethodislessefficientinthewhole.Anotheristousethedatacubetechnologyformulti-dimensionalassociationrulemining,thismethodhasgo

7、odI/Operformance,especiallywhenthedatacubeissmall,youcanusemulti-dimensionalarraysfortheeffectiverealization,butforalargedatabase,constructionandmaintenanceofthecorrespondingdatacubeisextremelyexpensive.The

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。