欢迎来到天天文库
浏览记录
ID:48008738
大小:166.48 KB
页数:3页
时间:2020-01-13
《时间序列度量的斜率偏离距离方法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、42009,45(22)ComputerEngineeringandApplications计算机工程与应用时间序列度量的斜率偏离距离方法研究梁建海1,张建业2,杨峰1,潘泉11,ZHANGJian-ye2,YANGFeng1,PANQuan1LIANGJian-hai1.西北工业大学自动化学院,西安7100722.空军工程大学,西安7100511.SchoolofAutomation,NorthwesternPolytechnicalUniversity,Xi’an710072,China2.AirForceEngineeringUniversity,Xi’
2、an710051,ChinaE-mail:konggongliang@163.comLIANGJian-hai,ZHANGJian-ye,YANGFeng,etal.Studyofdistance-measuringmethodintimeseriesbasedonslopedeparture.ComputerEngineeringandApplications,2009,45(22):4-6.Abstract:Aimingatthemeasuringmethodofsimilaritysearchintimeseries,asimilaritymeasuri
3、ngmethodbasedonslopedepartureisproposedinthispaper.Todisposethetimeseriesdatawithhighdimension,multi-property,noiseanddefault,asimilaritymeasuringmethodisusedtocaculatetheslopedeparturebasedonPLRsolvingthelocalizationofslopedistancemeasurement.Infact,thephysicalconceptofthismethodpr
4、ovesmoreclearlyandnicely.Thematurityandthecontinuityofslopedepartureareproved.Theexampleshowsitsvalidity.Keywords:timeseries;slopedeparture;distancemeasuring摘要:针对数据挖掘领域中时间序列的相似性度量问题,提出一种斜率复合偏离距离方法。以大量噪声的高维多元时间序列数据为目标,提出了一种基于斜率偏离度的时间序列相似性度量方法。该方法主要是在分段线性的基础上,基于角度和斜率进行偏离度计算,解决普通斜率距离度量
5、的局限性,物理意义更为明确,实际度量更为准确。证明了斜率复合偏离的完备性和连续性,最后用仿真算例对算法的有效性进行了验证。关键词:时间序列;斜率偏离;距离度量DOI:10.3778/j.issn.1002-8331.2009.22.002文章编号:1002-8331(2009)22-0004-03文献标识码:A中图分类号:TP181引言性的基础上,对斜率进行复合偏离度计算,解决普通斜率距离距离度量研究是相似性搜索的主要方向[1]。Lp范数距离度量的局限性,物理意义更为明确,实际度量更为准确。最后用中,L距离在测量误差满足加性拉普拉斯分布时最优[2],因此更仿真
6、算例对算法的有效性进行了验证。1适合于用于脉冲噪音环境下。L2距离在测量误差满足加性独立同高斯分布时最优[3]。Berndt和Clifford把在语音识别中广泛使2距离度量用的动态时间弯曲DTW距离引入时间序列的相似性查询研究2.1斜率距离中[4]。模式距离[5]是根据时间序列的变化趋势,在分段线性表示定义1设S′,S″表示两个等长的、在线性分段的基础上以的基础上,将序列分成若干个子集,每个子集代表一种模式。上斜率集表示的时间序列[9]:述距离受距离表示的非漏报性限制,高维数据的索引很难实现S′={(k1′,t2′),…,(k′i-1,ti′),…,(k′n-
7、1,tn′)}快速性[6],性能随维数的增长高速下降[7]。S″={(k″,t″),…,(k″,t″),…,(k″,t″)}12i-1in-1nKeogh提出逐段线性分割法PLR[8],模仿视觉将复杂的曲定义2由上述给出的S′,S″,令S′,S″的初始斜率距离线表示成几组直线段,对于高维数据的快速索引和查询非常有(InitialSlopeDistance,ISD)为:效,但在距离相同的情况下出现局部误差过大的问题。为了更nΣ(ti-ti-1)(k′i-1-k″i-1)好地描述和表现时间序列的整体和局部特征,提出了新的度量DISD(S′,S″)=i=2方法-斜率
8、偏离度量。tn提出了基于斜率偏离度量的
此文档下载收益归作者所有