欢迎来到天天文库
浏览记录
ID:39402408
大小:264.50 KB
页数:79页
时间:2019-07-02
《基于数据流的时间序列异常数据挖掘的研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、浙江理工大学硕士学位论文基于数据流的时间序列异常数据挖掘的研究姓名:黄志强申请学位级别:硕士专业:计算机应用技术指导教师:贾宇波20080301浙汀理工大学硕上学位论文摘要基于数据流的时间序列异常数据挖掘可以用于交通领域的道路推荐、供水领域的管网监测以及证券、医疗、环保、电力等行业的检测和预报工作。这些领域产生的数据有着明显的时间序列的特征,同时还具有数据量大、结构复杂、实时性要求高等特点。如果仪使用传统的理论和方法分析这些数据,往往因为计算能力、存储能力以及算法的不足而显得无能为力。数据流挖掘理论和技术的引入为解决上述问题提供了新的思路,越来越成为国内外
2、研究者所关注的热点。目前,时间序列的数据挖掘主要包括相似性查询、分类、聚类和异常检测等。论文围绕数据流环境下时间序列异常数据挖掘这一主题,以时间序列的模式表示为基础,讨论了时间序列数据预处理和压缩存储,提出了一种基于数据流的时间序列异常检测算法,并根据现实生活中多维数据流的需要和对历史数据的分析,将原算法进行了改进,最终确定了改进的基于数据流的时问序列异常检测算法。主要的研究内容和成果包括:1.时间序列的模式表示论文将解析几何中的线段概念和现实生活中的基本时间窗口引入到时间序列的研究中来,提取线段的斜率作为确定时间序列分段线性表示的分段点选取的依据,提出了
3、一种基于基本窗口和斜率的分段线性表示方法(简称为PLRBWS表示)。时间序列的PLRBWS表示方法简单直观,对于具有明显周期特征和短期模式波动频繁等特点的时间序列具有很强的数据压缩能力,从而能较好地保持时间序列总体模式的变化特征。2.时间序列的异常检测在时间序列的模式表示基础上,论文提出了基于滑动窗口的时间序列窗口异常的定义,同时给出了流数据环境下的基于滑动窗口的时间序列异常检测算法(简称TOD—SW),采用“窗口异常度”来衡量时问序列上当前窗口的异常程度。与其他异常数据挖算法相比,TODSW不需要训练,满足了数据流的实时性要求,在模式表示的基础上算法又一
4、定程度的降低了存储要求和I/O操作。只要合理地调整参数,算法总是能够及时、有效地检测出当前时间序列的异常行为。关键词:数据流;时间序列;数据挖掘;模式表示;异常检测基于数据流的时问序列异常数据挖掘的研究ResearchofoutlierdataminingintimeseriesbasedondatastreamAbstractOutlierdataminingintimeseriesbasedondatastreamcanbeusedtoroadplanningintransportation,networkmonitoringinwatersupply
5、,aswellasdetectionandpredictioninindustriessuchassecurities,medical,environmentalprotection,electricity,etc.Datageneratedfromthesefieldsnotonlyhavethecharactersoftimeseries,butalsovastdata,complexstructuresandhighrealtimedemand.Duetothelimitationofcomputingability,storageabilityan
6、dalgorithms,itisalwaysdifficulttoanalyzethesedatausingonlythetraditionaltheoriesandmethods.Theintroductionofdatastreamminingprovidesanewwaytosettletheabove-mentionedproblem,withincreasingimportanceattachedbyresearchersfrombothathomeandabroad.Atpresent,dataminingoftimeseriesmainlyi
7、ncludessimilarityinquiries,classification,clustering,outlierdetection,etc.Basedontimeseries’patternrepresentation,thedatapreprocessingandcompressionstorageoftimeserieswerediscussedinthispaper.Itwasfollowedbyaninitialalgorithmfortimeseriesoutlierdetectivebasedondatastream.Takingint
8、oaccounttherequirementofmultidime
此文档下载收益归作者所有