序列模式挖掘及其应用研究

序列模式挖掘及其应用研究

ID:12445748

大小:412.50 KB

页数:61页

时间:2018-07-17

序列模式挖掘及其应用研究_第1页
序列模式挖掘及其应用研究_第2页
序列模式挖掘及其应用研究_第3页
序列模式挖掘及其应用研究_第4页
序列模式挖掘及其应用研究_第5页
资源描述:

《序列模式挖掘及其应用研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、序列模式挖掘及其应用研究摘要序列模式挖掘是数据挖掘研究的一个重要的研究领域。目前,成熟的序列模式挖掘算法主要有三类:基于Apriori性质的候选码生成-测试的算法;基于垂直格式的候选码生成-测试的算法;基于投影数据库的模式增长算法。近年来,序列模式挖掘在分布式环境下的应用的研究逐渐成为热点,提出了各种算法。本文介绍序列模式挖掘算法及各自的优缺点和在分布式环境下的应用,在此基础上发现了分布式环境下站点之间局部模式子树的传输存在问题。本文提出了分布式环境下基于叶子节点传输的序列模式挖掘方法LMSP(leaf-basedminingofsequentialpatterns),即在生成全局L

2、2序列模式的过程中,各站点传输局部L2子树时只传输局部子树的叶子节点的序列以及所有节点的支持度计数,在选举站点上再根据接收到的子树信息将局部L2子树还原。接着又简单地提出约减的树结构的传输,除根节点外的每个节点都只记录相对其父节点的后缀序列。实验结果表明,LMSP算法性能优于FDMSP算法。文章最后简单的介绍了序列模式挖掘的实际应用。关键词:数据挖掘;序列模式;分布式算法;数据传输AbstractSequentialpatternminingisanimportantdomainofdatamining.Nowtherearethreetypesofmaturealgorithmso

3、fsequentialpatternsmining:Apriori-basedalgorithmsbycandidatesequencegenerating-and-testing;verticalformatdatabasebasedalgorithmsbycandidatesequencegenerating-and-testing;projectiondatabasebasedalgorithmswithbypattern-growth.Inrecentyears,miningofsequentialpatternsindistributedenvironmentisbecom

4、inghottopic,andsomealgorithmshavebeenproposed.Inthispaper,threealgorithmsofsequentialpatternminingandadvantagesanddisadvantagesofthemareintroduced,andthentheapplicationsofsequentialpatternminingalgorithmsindistributedenvironment.Sincethis,wefindaproblemoflocalpatternsubtreetransportationfromone

5、sitetoanotherindistributedenvironment.Inthispaper,weproposealeaf-basedalgorithmindistributedenvironment,LMSP(leaf-basedminingofsequentialpatterns),onlytransporttheleafnodesequencesandallthesupportcountsofthelocalL2subtree,whileeverysitetransportingthelocalL2subtreetopollingsiteinthecourseofglob

6、alL2patternsgenerating.Atpollingsite,wegetthelocalL2subtreebackfromreceivedsubtreemessage.Andwealsoproposetransportationofreductionsubtreesimply,allthenodes(excepttheroot)registeronlysuffixaccordingtoitsparentinsteadoftheentiresequence.TheexperimentsshowthatthealgorithmLMSPoutperformsthealgorit

7、hmFDMSP.Thelastpartofthispaper,wesimplyintroducetheapplicationsofsequentialpatternmining.Keywords:datamining;sequentialpattern;distributedalgorithm;datatransportation目录1. 引言11.1数据挖掘概述11.1.1什么是数据挖掘?11.1.2数据挖掘能做什么?11.1.3数据挖掘技术的发展前景2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。