式关联规则挖掘若干算法研究与实现

式关联规则挖掘若干算法研究与实现

ID:37615686

大小:3.35 MB

页数:83页

时间:2019-05-26

式关联规则挖掘若干算法研究与实现_第1页
式关联规则挖掘若干算法研究与实现_第2页
式关联规则挖掘若干算法研究与实现_第3页
式关联规则挖掘若干算法研究与实现_第4页
式关联规则挖掘若干算法研究与实现_第5页
资源描述:

《式关联规则挖掘若干算法研究与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、IIIIIIIIIPllllllllllllllIJIIIIllllllFIIIJIIJIllllJY1524114⑩浙炉z角矢乎硕士学位论文论文题目:坌查式羞珐趣到挖掘羞壬簋法瑟究皇塞瑟学科专业:一盐差趣廑凰技盎一一指导教师:蕉盎垒提交日期:2009年2月分布式关联规则挖掘符十算法研究’j实现分布式关联规则挖掘若干算法研究与实现摘要随着信息时代的到来和计算机网络技术的飞速发展,分布式环境日益普遍,而传统的集中式数据挖掘技术无法解决分布式下的挖掘问题,故在分布式下如何进行有效的数据挖掘成为当今人工智能研究领域一个热门课

2、题。关联规则是数据挖掘研究领域的一个重要问题,目前所面临的最大挑战是计算效率,内存和结果冗余问题。解决的途径之一是开发高效的分布式算法。因此本文从分布式的角度出发,针对关联规则挖掘理论和方法进行了深入研究,提出了若干高效的分布式关联规则挖掘算法。具体研究内容如下:第一,针对关联规则的问题及现有分布式系统体系结构的特点,根据数据分布和通信模型的不同,提出了两种分布式挖掘关联规则的框架:同步挖掘和异步挖掘。第二,分析当前分布式拓扑结构的特点,提出了网状分布式拓扑结构下关联规则同步挖掘算法NDMA和星型分布式拓扑结构下关联规

3、则异步挖掘算法SDMA算法。算法中用到的优化技术包括:基于哈希方法的候选集的划分和通信技术,候选集局部前缀树的构建和全局修剪技术,局部数据抽样技术及集成时的归纳学习和推导技术等,这些技术能产生较小的候选集,使候选集计数通信次数减为0(n),从而提高了算法效率,改善了内存使用情况。实验结果表明"NDMA算法在支分布式关联舰则挖掘若干算法研究.’j实现持度较低时执行效率比同类算法FDM高60%以上。算法中用到的提高挖掘精度的技术包括:提出候选频繁模式集降低分布式挖掘漏计概率;提出负边界和动态缩减的支持度解决抽样导致挖掘精度

4、不高的问题,定义了弃真和存伪两类错误来评估挖掘结果。实验结果表明:SDMA算法抽样率在25%就达到了弃真错误为1.6%,存伪错误为4.6%较高的挖掘精度。第三,针对现有分布式关联规则挖掘结果冗余的问题,设计了一个全新的分布式无冗余关联规则异步算法DGNRR。该算法摒弃了现存相关算法在分站点采用完全模式挖掘的方法,改用闭合模式挖掘。算法核心技术主要有定义了闭合模式传输格式和集成后的闭合模式格式,设计了根据源站点的不同的两套闭合模式集成规则,分析了无冗余关联规则的特点,在此基础上给出了从闭合模式产生无冗余关联规则的方法。最

5、后在稀疏型,密集型和介于稀疏型与密集型之间的三个数据集上验证了算法的可行性。第四,设计了一个分布式数据挖掘原型系统DDMine。系统采用EJB(EnterpriseJavaBeans)分布式组件技术,适合面向企业数据挖掘。在总结分布式数据挖掘系统时,提出了分布式关联规则算法设计的一般思路。关键词:分布式关联规则挖掘;分布式拓扑结构;闭合模式;无冗余关联规则;EJBU分布式关联规则挖掘若干算法研究0实现THESTUDYANDIMPLEMENTATIONOFSEVERALDISTIUBUTEDALGORITHMSFORMI

6、NINGASSOCAITIONRULESABSTRACTWiththecomingofinformationeraandrapiddevelopmentofcomputernetworktechnology,thedistributedenvironmenthasbecomeincreasinglypopular.However,thetraditionalcentralizeddataminingtechnologycannotcompletethedistributedminingtask,howtomineeff

7、icientknowledgefromdataunderdistributedenvironmenthasbecomeahottopicinartificialintelligencefield.Associationrulesminingisanimportanttaskofdatamining.Atpresent,mainchallengeisinefficiency,memorypowerandtheredundantissue.Developingdistributedminingalgorithmsisabe

8、tterchoice.So,inthisthesis,wefocusonresearchondistributedminingassociationrules,andproposeseveralefficientdistributedalgorithms.Thefollowingisourmainresearchworks:Fir

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。