加权关联规则优化算法研究

加权关联规则优化算法研究

ID:33533124

大小:2.23 MB

页数:61页

时间:2019-02-26

加权关联规则优化算法研究_第1页
加权关联规则优化算法研究_第2页
加权关联规则优化算法研究_第3页
加权关联规则优化算法研究_第4页
加权关联规则优化算法研究_第5页
资源描述:

《加权关联规则优化算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、⑧⋯IvlASTER⋯'STtiE刚硕士学位论文加权关联规则优化算法研究论文作者:余方兴指导教师:戴上平副教授学科专业:计算机应用技术研究方向:数据挖掘华中师范大学计算机学院2014年5月⑧硕士学位论文MASTER’STHESISOptimizationAlgorithmofWeightedAssociationRulesMiningAThesisSubmittedinPartialFulfillmentoftheRequirementFortheM.s.DegreeinComputerScienceYuFangxingPostgraduateP

2、rogramSchoolofComputerCentralChinaNormalUniversitySupervisor:DaiShangpingAcademicTitle:AssociateProfessorSignatureApprovedMay,2014⑧硕士学位论文MASTER‘STHESIS华中师范大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个

3、人和集体,均已在文中以明确方式标明。本声明的法律结果由本人承担。储张徐张日期:刀I胗年岁月2易日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中师范大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同意华中师范大学可以用不同方式在不同媒体上发表、传播学位论文的全部或部分内容。作者签名:套另哭日期:纠中年岁月2占日导师签名:日期:‘,oI本人已经认真阅读“C

4、ALLS高校学位论文全文数据库发布章程”,同意将本人的学位论文提交“CALIS高校学位论文全文数据库”中全文发布,并可按“章程”中的规定享受相关作者签名:日期:z,/上t年⑩硕士学位论文MASTERlSTHESIS摘要关联分析是数据挖掘领域的主要分支,用于发现隐藏在数据中有意义的联系。该领域中,加权关联规则挖掘算法与传统算法相比,更有利于解决数据库中项目分配不均和重要程度不同的问题,因此相关研究越来越受到人们重视。本文重点研究加权关联规则算法。首先系统介绍了流行的加权关联规则模型,比较了他们的优劣势。在深入研究各个模型的优点的基础上采用了一种基于

5、聚类和压缩矩阵的加权关联规则挖掘策略,挖掘加权频繁项集。其主要思想是采用矩阵作为数据库数据存储运算结构,运用空间换时问的思路减少数据库访问频率,利用聚类划分的方法分解数据库,进行分布挖掘,降低内存占甩空问,通过局部频繁项集生成全局频繁项集,引入事务权重和数据库权重的概念优化权值计算方法,使其满足支持度度量的反单调性,提升拼接和剪枝水平,与传统加权算法相比,减少了访问数据库的频次,提高了候选项集剪枝效率,整体上提升了算法的性能和准确度。同时,为了避免由单支持度导致的挖掘低兴趣度的规则以及出现冗余无效规则等问题,本文借鉴动态更新的思想引入了多最小支持

6、度的概念,结合垂直数据和项集等价划分的思想,设计了一种新的基于多支持度的加权关联规则挖掘算法(ANewAlgorithmofWeightedAssociationRulesMiningwitllMultipleMinimunlSupports,NAWARMMMS),该算法中不同项集对应给定的不同的最小支持度,通过对项目设置不同的支持度阈值,实现在不同重要程度的数据项中挖掘出数据量小,但用户更感兴趣、更有价值的关联规则。仿真实验中,通过测试在不同事务数、不同支持度、不同项目数以及不同项目稠密度的情况下算法的运行时间,验证了改进的基于聚类和压缩矩阵的

7、加权关联规则算法,在处理低稠密度数据时,具有更大的优势,算法复杂度优于基本加权关联规则算法;而进一步的对于改进后的NAWARMMMS算法,测试在不同阈值整体水平和不同事务数的情况下运行时问,实验表明,由于垂直数据存储结构、矩阵压缩方法以及项集等价划分策略的引入,使得算法在I/0负载、候选项集和事务压缩规模上都得到优化,整体性能略优于传统多支持度算法。关键词:加权关联规则,压缩矩阵,多最小支持度,等价划分⑧硕士学位论文MAS丁ER’SrIHESISAbstractAsamainbranchinthefieldofdatamining,associa

8、tionanalysisisusedtofindmeaningfulconnectionshiddeninthedata.InthjSa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。