资源描述:
《在线分割时间序列数据-软件学报》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、1000-9825/2004/15(11)1671©2004JournalofSoftware软件学报Vol.15,No.11∗在线分割时间序列数据1,2+2李爱国,覃征1(西安科技大学计算机科学技术系,陕西西安710054)2(西安交通大学计算机科学技术系,陕西西安710049)On-LineSegmentationofTime-SeriesData1,2+2LIAi-Guo,QINZheng1(DepartmentofComputerScienceandTechnology,Xi’anUniversityofScienceandTechnology,Xi
2、’an710054,China)2(DepartmentofComputerScienceandTechnology,Xi’anJiaotongUniversity,Xi’an710049,China)+Correspondingauthor:Phn:+86-29-82663979,E-mail:liag@xust.edu.cnReceived2003-07-02;Accepted2004-02-05LiAG,QinZ.On-Linesegmentationtime-seriesdata.JournalofSoftware,2004,15(11):1671~
3、1679.http://www.jos.org.cn/1000-9825/15/1671.htmAbstract:Segmentationoftimeseriesisoneoftheimportanttasksintimeseriesdatamining.Segmentationhastwomajoruses:Itmaybeperformedeithertodetectwhenthesystemthatcreatesthetimeserieshaschangedortocreateahighlevelrepresentationofthetimeseries
4、forindexing,clustering,andclassification.Approachestoon-linesegmentationoftimeseriesarenecessarywhenidentifyingandpredictingtemporalpatternsinreal-timetimeseriesdatabasesareneeded,andthisisthefocusofthispaper.Aformaldescriptionofsegmentingtimeseriesproblemandacriterionfortheevoluti
5、onofsegmentationalgorithmsarepresented.Anon-lineiterativealgorithmofsegmentingtimeseries,calledOLS(on-linesegmentation),isthenproposed.OLSisindependentofaprioriknowledgeaboutthesegmentedtimeseries.ExperimentalresultsdemonstratethatOLScanon-linedetectthecriticalchangepointsoftimeser
6、ieswithless‘overfit’thanthatofcompetitivealgorithms.Keywords:datamining;knowledgeacquisition;timeseries;segmentation摘要:时间序列分割是时间序列数据挖掘研究的重要任务之一.它主要有两个应用:检测生成时间序列的系统何时发生变化;创建时间序列的高级数据表示,从而对时间序列进行索引、聚类和分类.在实时时间序列数据挖掘应用中,需要在线时间序列分割算法,以便实时发现和预测时态模式.在对时间序列分割问题进行形式化描述的基础上,提出了一种评估时间序列的分割结
7、果以及分割算法性能的评价指标,并提出了一种在线分割时间序列数据的递推算法(on-linesegmentation,简称OLS).OLS的一个显著特点是不依赖有关时间序列的先验知识.实验结果说明,OLS算法能够有效地在线检测出数据挖掘应用中感兴趣的关键变化点,而且“过拟合”程度低.关键词:数据挖掘;知识获取;时间序列;分割∗SupportedbytheKeyScience-TechnologyProjectofthe‘TenthFive-Year-Plan’ofShaan’xiProvinceofChinaunderGrantNo.2000K08-G12(陕西
8、省科学技术发展计划“十五”攻关项目)作者简介:李爱国