基于相似性分析时间序列数据挖掘算法的研究

基于相似性分析时间序列数据挖掘算法的研究

ID:32248700

大小:2.23 MB

页数:73页

时间:2019-02-02

基于相似性分析时间序列数据挖掘算法的研究_第1页
基于相似性分析时间序列数据挖掘算法的研究_第2页
基于相似性分析时间序列数据挖掘算法的研究_第3页
基于相似性分析时间序列数据挖掘算法的研究_第4页
基于相似性分析时间序列数据挖掘算法的研究_第5页
资源描述:

《基于相似性分析时间序列数据挖掘算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浙江人学硕上学位论文摘要时间序列是指随着时间变化而形成的有序数据序列,它频繁地出现在金融、商业、科学和医疗等各个领域。如何管理和利用这些时序数据,发现隐藏在它们背后的规律和知识,成为人们日益关注的问题。本文在国内外时间序列数据挖掘最新研究的基础上,从相似性分析出发,研究了时间序列分段线性表示和多模式匹配等问题。本文的主要工作和创新如下:1.研究了时间序列的表示方法、相似性度量和相似性搜索,并对其主要技术做了详细介绍和优缺点分析。2.定义了极值噪声和转折点,在此基础上提出了基于转折点的分段线性表示方法。该方法选择极值点作为候选点,并将插值误差不超过阈值的候选点识别为噪声。实验表明,该

2、方法在多种领域的数据集上具备更小的拟合误差,且在处理大数据量时具有较高的稳定性。3.提出了基于转折点的白适应分段线性表示方法。该方法以转折点为初始分段点,启发式地选取插值误差最大的数据点作为关键点。实验表明,在多种领域的数据集上,该方法可以大幅度地降低拟合误差。经过优化后,该方法的时间复杂度与时间序列的长度成近似线性关系。4.提出了基于分段聚合近似的包络线下界算法。本文借助分段聚合近似的降维能力,将其引入包络线下界算法,同时证明了下界定理,保证不会引起漏报。经过理论分析,当阈值r选择合适时,该算法的性能较经典算法和包络线下界算法有较大提升,能够处理更高带宽的流式时间序列。关键词:时

3、间序列,相似性分析,分段线性表示,极值噪声,转折点,多模式匹配,下界定理AbstractTimeseriesisfomedovertimeordereddataseries,、Vhich丘.equently印pearsinfinancial,commercial,scientinca11dmedicalfields.Howtomanageandexploitthese(1ataaJldhowt0findthe1awandl(nowledgebellindt11em,haSbecome觚incre商nglyimereStedproblem.0nthebasisoftllelateSt

4、researChathomeandabroad,piecewiselinearrepresentationa11dmulti—pa_ttemmatchingaresmdied.ThemainworkaIldi衄oVationareaSfollows:1.S硼ytimeseriesrepresentatioIl,simil撕够meausureandsimilari够searchandmal(eadetailedanalysisont11emailladValltagesanddisadVantages.2.Defineex仃emanoiseandchangepoint,andprop

5、oseapiecewiselinearrepresentationmethodbasedonchangepoim.Themethodchoosesextremasascandidatesandidentifiesnoisesonthepointswhoseirlte印olationerrorare、)~ritllint11emreshold.ExperimentsshowthatthemethodgainSasmallerfittinge仃IDriIlaV抓etyofdatasets,andahi曲鼬il时i11processinglarge锄oumsofdata.3.Propos

6、ea11adaptivepiecewiselinearrepresentationmethodbaSedonchangepoint.ThemethodchooseschangepoimsaSiIlitialsegmentationpoims,andthenheuristicallyselectskeypo洫tswim也ela略estinte印olatione盯or.Exp甜men诅lresultsshowthatthemethodcall伊eatlyreducetllefittingerrorinmanyfieldsofdatasets.4.ProposeanenvelOpe10w

7、el‘-boundingalgorithmbasedonpiece、析seaggregate印proximation.111ispaperadoptstlledimensionreductiona_bili哆ofpiecewiseaggregateapproximationandproVestllelowerboundingtlleorem.FromthettleoreticalaIlalysis,whenchoosingaIl印propria_tetllreshol

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。