试析基于间隔事件的时间模式挖掘算法研究

试析基于间隔事件的时间模式挖掘算法研究

ID:35188576

大小:1.43 MB

页数:60页

时间:2019-03-21

试析基于间隔事件的时间模式挖掘算法研究_第1页
试析基于间隔事件的时间模式挖掘算法研究_第2页
试析基于间隔事件的时间模式挖掘算法研究_第3页
试析基于间隔事件的时间模式挖掘算法研究_第4页
试析基于间隔事件的时间模式挖掘算法研究_第5页
资源描述:

《试析基于间隔事件的时间模式挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工学硕士学位论文基于间隔事件的时间模式挖掘算法研究RESEARCHONTEMPORALPATTERNMININGALGORITHMBASEDONINTERVALEVENTS闫学凯哈尔滨工业大学2010年12月国内图书分类号:TP391.03学校代码:10213国际图书分类号:621.3密级:公开工学硕士学位论文基于间隔事件的时间模式挖掘方法研究硕士研究生:闫学凯导师:张春慨副教授申请学位:工学硕士学科:计算机科学与技术所在单位:深圳研究生院答辩日期:2010年12月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.03

2、U.D.C:621.3DissertationfortheMasterDegreeofEngineeringRESEARCHONTEMPORALPATTERNMININGBASEDONINTERVALEVENTSCandidate:XuekaiYanSupervisor:AssociateProf.ChunkaiZhangAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScience&TechnologyAffiliation:ShenzhenGraduateSch

3、oolDateofDefence:Dec,2010Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要本文研究了有时间间隔的事件的挖掘问题。假设原始数据库由事件序列集构成,其中事件发生在时间间隔内,我们的目的是挖掘出数据库中频繁发生的间隔事件间的时间关联规则。之所以进行这项工作是因为我们观察到在实际生活中,很多事件并不是瞬时发生的,而是发生在一段时期内。因此,许多诸如网络监测,交易记录和医疗数据库的分析等实际应用都需要挖掘出间隔事件之间的关系。本

4、文改进了现有的被称为EMEMISP(ExtendingofMEMoryIndexingforSequentialPatternmining)的算法,该算法用来从间隔事件数据中挖掘时间关联规则。在序列模式挖掘领域,MEMISP算法比其他诸如GSP和PrefixSpan等算法更高效,因此EMEMISP算法选择了扩展该算法,使其应用于基于间隔事件的时间关联规则挖掘领域。和EMEMISP算法相比,改进后的算法主要做了两个方面的提高。首先,在挖掘过程中,我们基于Apriori算法原理应用了剪枝策略,这将有效的降低算法的计算量。其次,和EMEMISP算

5、法将每个模式中涉及的所有事件间的关系全部存储起来不同,我们只存储频繁2-模式中事件间的关系,在存储其他的n-模式时(n>2),通过增加相应的指针来指向对应的频繁2-模式。类似于EMEMISP算法,改进后的算法同样要求首先扫描数据库,并且不需要生成候选模式集和数据库映射。在得到所有的频繁模式后,应用相应的算法得到我们感兴趣的时间关联规则。除了改进EMEMISP算法外,本文还在此基础上研究了一些诸如最小支持度,最大时间差等关键参数对时间模式挖掘算法的影响。关键字:事件序列;时间间隔;EMEMISP算法;时间模式挖掘I哈尔滨工业大学工学硕士学位论

6、文AbstractTheproblemofminingfrequentpatternsfrominterval-basedeventsisstudied.Itisassumedthatthedatabaseconsistsofsequencesofevents,whereaneventoccursduringatime-interval.Thegoalistominetemporalarrangementsofeventintervalsthatappearfrequentlyinthedatabase.Themotivationofthi

7、sworkistheobservationthatinpracticemosteventsarenotinstantaneousbutoccuroveraperiodoftime.Thus,therearemanypracticalapplicationsthatrequireminingsuchtemporalcorrelationsbetweenintervalsincludingthenetworkmonitoring,dataanalysisofmarketingrecordsfromsupermarketsormedicaldat

8、aset.WeimprovedanexistingalgorithmcalledEMEMISP(ExtendingofMEMoryIndexingforSequentialPat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。