欢迎来到天天文库
浏览记录
ID:33614513
大小:709.77 KB
页数:5页
时间:2019-02-27
《时间序列数据挖掘综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第24卷第11期计算机应用研究Vol.24No.112加7年11月ApPlicationRese二hofCo哪ut。Nov.2(X)7时间序列数据挖掘综述贾澎涛,,何华灿,,刘‘丽‘,孙涛2(1.西北工业大学计算机学院,西安710072;2.西安科技大学建筑与.土木工程学院,西安71(X)54)摘要:在综合分析近年来时间序列数据挖掘相关文献的基础上,讨论了时间序列数据挖掘的最新进展,对各种学术观点进行了比较归类,并预浏了其发展趋势。内容涵盖了时间序列数据变换、相似性搜索、预浏、分类、聚类、分钊、可视化等方面,为研究者了解最新
2、的时间序列数据挖掘研究动态、新技术及发展趋势提供了参考。关键词:时间序列;数据挖栖;相似性搜索;模式发现中图分类号二T玛n.巧文献标志码:A,文章编号:1001一3695(2(X)7)11一0015一04overviewofti】11esefleSdataIlllnlllgHEHua-Can,UUUI,SUNTaoZUn。勿,Xi’“71加72ch云na;2.&爪扣ZofArch翻即名,舌6沉IE昭1抽阳行矛茗,china)A加tract:Basedonan脚zingmanyliteraturesabolltti,.erie
3、sdata面ning,thioPa伴rshowed.rth6develOPment,acade而c0砰n脚sandnroposedabouttimesetiesdata而ningrecently.Theconteniscontaineddatat仙忘如功坦tion,similaritymatch,Prediction,class币cation,cluotering,segnlentationandvisualizationOftimeSeries.TheaimwastocomPareandclosifytheselitera
4、t吟sandputforwardreferenceforschola铭whoresearehdevelopment,newtechniquesand晚ndsoftimeserieodatamlning·Keywords:timeseri韶;data而ning;simil耐ty~h;Pattemdiscovery数据挖掘是知识发现过程中的一个步骤。它主要是利用(‘二,0二)},满足t‘5、挖掘出有价值的知识[’〕。原则上讲,数据挖掘可以应用于间序列数据库的挖掘就是时间序列数据挖掘。时间序列数据任何类型的信息源。这包括关系数据库、数据仓库、事务数据挖掘是时间序列数据库中知识挖掘的一个步骤,它发现时间序库、其他高级数据库系统、平面文件(伽fi俪)和WWW上的数列数据中的时态模式或模型I3)。据[2]。在这些数据集之中,有一类数据集的数据之间存在着,.2时间序列挖掘的任务时间上的关系,这类数据被称为时间序列。在对时间序列进行从不同的角度出发,TSDM的研究者给出了不同的TSDM数据挖掘的过程中,必须考虑数据集之中数6、据间存在的时间关的综述。这些综述的侧重点各不相同〔3一j,有的侧重时间序列系,这类数据挖掘称为时间序列数据挖掘(timeseriesdata而-模式的聚类与分类[’1,有的侧重阐述当前研究中存在的不n吨,巧DM)。KeoghL’」认为时间序列是普遍存在的,图像数足川,有的侧重时间序列相似搜索困,有的侧重模式发现与时据、文本数据、影像数据、手写体数据、脑扫描数据等都可看做间序列预测1’一j。因此这些研究者对%DM的任务理解也有是时间序列。研究如何有效地从这些复杂的海量时间序列中差异。由于人们对时间序列研究目的不同,自然会对竹D7、M的挖掘潜在的有用知识,具有重要的理论价值和现实意义。因此研究任务提出不同的观点。综合收集到的资料,将巧DM的研件DM已成为数据挖掘研究的一个重要分支。究任务归纳为如下六点:时间序列相似性搜索;时间序列聚类;时间序列分类;时间序列相关规则提取与模式分析;海量1时间序列挖掘时间序列可视化;时间序列预测。,.1时间序列的定义---------一一从丙间序列雨角度来看,每个数据单元可以被抽象为一个2时间序列数据挖掘的主要研究内容二元组(t,0)。其中:‘为时间变量;。为数据变量,反映数据单竹DM始于20世纪90年代开始的数据库相似8、搜索的研元的实际意义,如某种商品的销售金额、股票的价格等。由此,究。R.A脚w司等人[9]于1993年发表了第一篇关于时间序列对于时间序列可以给出如下定义:数据库相似搜索的研究论文;c.Faloutso。等人110)于1994年定义1时间序列R是一个有限集{(:1,。,),(tZ,。2),
5、挖掘出有价值的知识[’〕。原则上讲,数据挖掘可以应用于间序列数据库的挖掘就是时间序列数据挖掘。时间序列数据任何类型的信息源。这包括关系数据库、数据仓库、事务数据挖掘是时间序列数据库中知识挖掘的一个步骤,它发现时间序库、其他高级数据库系统、平面文件(伽fi俪)和WWW上的数列数据中的时态模式或模型I3)。据[2]。在这些数据集之中,有一类数据集的数据之间存在着,.2时间序列挖掘的任务时间上的关系,这类数据被称为时间序列。在对时间序列进行从不同的角度出发,TSDM的研究者给出了不同的TSDM数据挖掘的过程中,必须考虑数据集之中数
6、据间存在的时间关的综述。这些综述的侧重点各不相同〔3一j,有的侧重时间序列系,这类数据挖掘称为时间序列数据挖掘(timeseriesdata而-模式的聚类与分类[’1,有的侧重阐述当前研究中存在的不n吨,巧DM)。KeoghL’」认为时间序列是普遍存在的,图像数足川,有的侧重时间序列相似搜索困,有的侧重模式发现与时据、文本数据、影像数据、手写体数据、脑扫描数据等都可看做间序列预测1’一j。因此这些研究者对%DM的任务理解也有是时间序列。研究如何有效地从这些复杂的海量时间序列中差异。由于人们对时间序列研究目的不同,自然会对竹D
7、M的挖掘潜在的有用知识,具有重要的理论价值和现实意义。因此研究任务提出不同的观点。综合收集到的资料,将巧DM的研件DM已成为数据挖掘研究的一个重要分支。究任务归纳为如下六点:时间序列相似性搜索;时间序列聚类;时间序列分类;时间序列相关规则提取与模式分析;海量1时间序列挖掘时间序列可视化;时间序列预测。,.1时间序列的定义---------一一从丙间序列雨角度来看,每个数据单元可以被抽象为一个2时间序列数据挖掘的主要研究内容二元组(t,0)。其中:‘为时间变量;。为数据变量,反映数据单竹DM始于20世纪90年代开始的数据库相似
8、搜索的研元的实际意义,如某种商品的销售金额、股票的价格等。由此,究。R.A脚w司等人[9]于1993年发表了第一篇关于时间序列对于时间序列可以给出如下定义:数据库相似搜索的研究论文;c.Faloutso。等人110)于1994年定义1时间序列R是一个有限集{(:1,。,),(tZ,。2),
此文档下载收益归作者所有