欢迎来到天天文库
浏览记录
ID:46584949
大小:436.42 KB
页数:10页
时间:2019-11-25
《时间序列分类问题的算法比较》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、万方数据第30卷第8期计算机学报v0I.30No.81111芝!星呈坚!些至!三!里坚里型垒至竺!曼窒丝呈竺三星里!垒:!:!!!!时间序列分类问题的算法比较杨一鸣”潘嵘”潘嘉林2’杨强”。’李磊”1’(中山大学软件研究所广州510275)”(香港科技大学计算机科学与工程系香港)摘要时问序列分类是时间序列数据分析中的重要任务之一,不硒于时间序列分析中常用的算法与问题,时闻序列分类是要把整个时间序列当作输人.其目的是要赋予这个序列某个离散标记.它比一般分类问题困难,主要在于要分类的时间序列数据不等长,这使得一般的分类算法不
2、能直接应用.即使是等长的时间序列,由于不同序列在相同位置的数值一般不可直接比较,一般的分类算法依然还是不适合直接应用.为了勰决这些难点,通常有两种方法:第一,定义合适的距离度量(这里,最常用的距离度量尾DTw距离),使得在此度量意义下相近的序列有相同的分类标签,这类方法属于领域无关的方法I第二,首先对时间序列建模(利用序列中前后数据的依赖关系建立模型).再用模型参数组成等长向量来表示每条序列,晟后用一般的分类算法进行训练和分类,这类方{击属于领域相关的方法.长期以来,研究者往往只倾向于使用其中一种算法,而这两类算法的比较
3、却比较缺乏.文中深人分析了这两类方法,并且分别在不同的合成数据集和宴际数据集上比较了两类方法.作者观测到了两类算法在不同因素影响下的性能表现,从而为今后发展新的算法提供了有力依据.·关毽词分类’时间序列;基于模型聚类}马尔可夫模型;统计学习中田法分类号TP311AComparatiVeStudyonTimeSeriesClassificationYANGYi—Min91’PANRon矿PANJia_Lin2’YANGQian91m’uLeil’1’(sD^M心hjf彻?Fts州hPscn哳⋯,l鲫,G弛孵柚似510275
4、)2’(皿,Ⅱ一眦毗。,CM节“妒&晰卯4耐£ngl揪增,Ho憎K删gU毗wlf咿。,&㈣耐T“加如gy,H删gK删g)Abstl'ctTimes盯iesclassificationorcategorizationisanimportanttaskintime—seriesanalysi8.Unliketraditionalmethodsandproblemformulationsintime—seriesanalysis,timeseriesclassifi—cationaimstotakewholetimeseque
5、ncesasinput,andproducediscreteIabelsthatareassignedtoeachsequence.Comparedtotraditionalclassificationproblems,timeseriesclassificationposesadditionaldifficulties.AmajordiffIcultyisduetothefactthatthetimesequencesarevariableinIength,maki“gmanytradltionalclassifica
6、tionmethodsunabletoappIydirectly.Evenforse—quencesofuniform1engths,manymeth。dscanstillnotbeapplieddirectIybecauseo“enthedata10catedatdifferentpartsofthesequencesareincomparable.Twomethodshavebeentriedsepa—ratelyinthepast,includi“gdistancebasedmethodssuchasDTW,and
7、modelbasedmethodssuchasMarkovmodels.Usi“geitherofthesemethodsaspreprocessingsteps,auniform1engthVect。r8pacecanbebuiIttoenabJethecIassmcationmethodstobeappIie也Inthepast,therehasbeenalackofcomparisonbetweenthesetwomethods.ThisP8percomparesdistanceandmodelbasedmetho
8、dsonseveraldatasetsincIudingsyntheticandrealdatasets,toexplicatetherelativeadvantagesanddisadvantagesofthesemethods.Thispaperpresentsseveralkeyobservationson收稿
此文档下载收益归作者所有