序列模式挖掘中的增量式更新算法研究

序列模式挖掘中的增量式更新算法研究

ID:33749373

大小:362.85 KB

页数:49页

时间:2019-02-28

序列模式挖掘中的增量式更新算法研究_第1页
序列模式挖掘中的增量式更新算法研究_第2页
序列模式挖掘中的增量式更新算法研究_第3页
序列模式挖掘中的增量式更新算法研究_第4页
序列模式挖掘中的增量式更新算法研究_第5页
资源描述:

《序列模式挖掘中的增量式更新算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、江苏科技大学硕士学位论文序列模式挖掘中的增量式更新算法研究姓名:刘月波申请学位级别:硕士专业:计算机应用技术指导教师:陆介平20050314Abstract序列模式挖掘中的增量式更新算法研究摘要序列模式挖掘是指挖掘相对于时间或其他模式出现频率高的模式是数据挖掘的[12]一个重要分支在交易数据分析病症分析Web日志分析天气预报等领域具有广泛的应用前景本文选择序列模式作为研究对象系统的分析了当前序列模式挖掘的现状针对一般序列模式算法交互式序列模式增量式序列模式三个方面展开研究和实验主要研究工作和成果有1分析了序列模式国内外的研究现状从序列模式挖掘的基本方法和序

2、列模式挖掘现有的模型两个角度对相关文献进行归类分析2提出了一种基于CTID的改进算法SPM(SequentialPatternsMining)该算法利用时序连接将时序情况分为时序前缀和时序后缀两种情况进行计算可以得到更多有效序列并且在剪枝过程中充分利用CTID表的特点简化了剪枝步骤从而提高了算法效率3提出了一种基于投影数据库的交互式序列模式挖掘算法FISP(FastInteractiveSequentialPatternsMining)在实际挖掘的过程中用户通常会指定不同的最小支持度以得到满意的序列模式所以整个挖掘过程是一个迭代和交互的过程如果支持度改变时

3、重新挖掘显然是低效的FISP利用前次挖掘得到的序列来缩减本次挖掘的投影数据库并设置了一个全局阈值来减少整个交互过程的时间和空间消耗4提出了基于投影数据库的增量式更新算法ISMP(IncrementalSequentialPatternsMiningBasedonProjectedDatabase)数据库往往是随时间动态更新的更新后一部分旧的序列模式可能会不再满足最小支持度并且会有新的序列模式出现在处理具有大量数据的大型数据库时对整个数据库重新执行一般的序列模式挖掘算法显然是低效的因此需要有效的算法来更新维护和管理已经发现的知识以反映这种交易数据库的动态更新

4、ISMP用间接拼接更新已经得到序列用增量数据库来减小投影数据库提高了算法效率并且考虑了数据库减小时的序列模式更新当增量数据库较大时算法效率更高通过实验对上述三种算法进行了验证结果表明算法是有效可行的关键字数据挖掘序列模式交互挖掘增量式挖掘投影数据库AbstractResearchofIncrementalSequentialPatternsMiningAbstractSequentialpatternminingistheminingoffrequentlyoccurringpatterns[12]relatedtotimeorothersequences

5、,whichisanimportantbranchofdatamingwithbroadapplications.Sequentialpatternminingisusefulintheanalysisofsuchdatafortargetedmarketing,customersretention,illsymptomanalysis,weatherpredictionandsoon.Thisthesisengagesintheresearchofbasicsequentialpatternmining,Interactivesequentialpatt

6、ernminingandIncrementalsequentialpatternmining.Herearefourmaincontentsandachievements:1.Havingintroducingthesituationofcurrentapproachesforsequentialpatternsmining.Themethodsofsequentialpatternsminingareanalizedfromtwoaspectsrespectively.Oneoftheaspectsisthebasicmathodsofsequentia

7、lpatternsmining,andtheotheristhesequentialpatternminingmodelsnowadays.2.ProposeanimprovingalgorithmbasedontheconceptofCTID,calledSPM.SPMdiscoversfrequentsequenceswithfrequentitemsetsandexistingpatternsandgeneratesmoreefficientpatternsbytemporalprefixandprofix.Furthermorethesimplif

8、iedpruningbasedonthecharactersofC

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。