时间序列相似搜索方法的研究

时间序列相似搜索方法的研究

ID:36774498

大小:2.49 MB

页数:66页

时间:2019-05-15

时间序列相似搜索方法的研究_第1页
时间序列相似搜索方法的研究_第2页
时间序列相似搜索方法的研究_第3页
时间序列相似搜索方法的研究_第4页
时间序列相似搜索方法的研究_第5页
资源描述:

《时间序列相似搜索方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、时间序列相似搜索方法的研究摘要时间序列相似搜索的研究专业:计算机软件与理论硕士生:涂宇指导老师:刘玉葆副教授摘要时间序列数据泛指随时问或空间有序变化的数据,这些数据往往采用等时间或等空间间隔测量。时间序列数据广泛应用于商业、经济、地质、生物医药、太空探测等诸多科学工业领域中。如何充分有效地管理和利用这些时间序列数据,从中发现隐藏的规律和知识,受到广泛关注。由于时间序列数据具有高维性、噪声干扰及波动性等特点,因此时间序列数据挖掘成为数据挖掘中的一个重要研究方向。时间序列数据挖掘大体可以分为时间序列表示和挖掘两个阶段。时间序列表示是提取时间序列的主要特征,在更高层次上

2、对时间序列重新描述。挖掘是指对表示后的时间序列做进一步的数据挖掘工作。本文主要在时间序列表示和相似搜索方面做了相关研究。本文主要工作为如下几个方面:1.时间序列的表示是时间序列数据挖掘研究的基础。重要点的分段表示法(IP)是目前应用最为广泛的时间序列特征提取方法之一,具有较好的数据压缩和去除噪声能力,但参数的选择对时间序列的近似效果有很大的影响。基于多分辨率的重要点检索分段方法(MIP)也是一种时间序列特征提取方法,该方法能很好的近似时间序列,但运行效率比较低。为了改进以上两种方法的不足,我们提出了一种改进的序列分段的方法:基于重要点的多分辨率检索表示法。针对时间

3、序列的benchmark做了大量的实验,从误差,压缩率、效率等方面来衡量本文方法和前面两种方法。实验表明,与基于重要点的分段方法相比,MRIP方法能对时间序列进行更好的压缩,误差更小,有更好的近似效果;与基于多分辨率的重要点检索分段方法相比,在近似效果相当的情况下,运算效率更高。2.基于BIRCH聚类特征及凝聚层次聚类的思想和时间序列数据相邻的点有内在的依赖关系,本文提出了基于聚类特征的时间序列划分算法(SegmentationalgorithmfortimeseriesbasedonBIRCHClustering,简称SBC)。对时间序列的l时间序列相似搜索方法

4、的研究摘要benchmark做了相关划分实验,并和经典的SW划分算法进行实验对比。通过实验结果分析,本文划分方法能达到很好的划分性能。3.采用基于重要点的多分辨率检索表示法提取特征模式后,对提取的模式序列提出了基于斜率模式的动态时间弯曲距离度量(Slope。采用基于.DTW)BIRCH聚类特征的时间序列划分算法提取特征模式后,对提取的模式序列介绍了基于均值模式的动态时间弯曲距离度量(Mean实验,本文提出和介绍的距离度量有很好的过滤性能。与全序列DTw搜索相比,只对极少量满足过滤条件的序列与待搜索序列进行全序列DTW距离计算,在时间性能上有很大的提高。关键字:数据

5、挖掘时间序列划分算法相似搜索Ⅱ时间序列相似搜索方法的研究ABSTRACTResearchonSimilaritySearchinginTimeSeriesDatabaseMajor:ComputerSoftwareandTheoriesName:砌翰Supervisor:AssociateProfessorLiuYubaoABSTRACTAtimeseriesreferstoadatasequenceofobservationswhichareorderedandintervalintimeorspace,whichiswidelyemployedincommer

6、cial,economic,geology,bio-medicine,spaceexplorationandmanyotherscientificandindustrialfields.HowtomanageandUSethesetimeseriesdataeffectivelyandhowtodiscoverhiddenrulesandknowledgefromthemisaninterestingproblemBut,timeseriesdatausuallyhavehighdimensionality,noiseandvolatility.Therefore

7、,timeseriesdataminingisoneofthemostimportantresearchfieldsofdatamining.Timeseriesdataminingcanhedividedintotwostages,timeseriesrepresentationandmining.Thefirststage,timeseriesrepresentation,referstoextractionthemainfeaturesandahighlevelfeaturedescriptionoftimeseries.Andthesecondstage,

8、minin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。