基于波动特征的时间序列数据挖掘.pdf

基于波动特征的时间序列数据挖掘.pdf

ID:57067089

大小:274.08 KB

页数:5页

时间:2020-07-31

基于波动特征的时间序列数据挖掘.pdf_第1页
基于波动特征的时间序列数据挖掘.pdf_第2页
基于波动特征的时间序列数据挖掘.pdf_第3页
基于波动特征的时间序列数据挖掘.pdf_第4页
基于波动特征的时间序列数据挖掘.pdf_第5页
资源描述:

《基于波动特征的时间序列数据挖掘.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第卷第期控制与决策年月ControlandDecision文章编号:()基于波动特征的时间序列数据挖掘武红江,赵军平,彭勤科,黄永宣(西安交通大学电信学院,西安)摘要:针对相似度搜索是时间序列数据挖掘的基础,构造鲁棒的动态时间弯曲距离是相似性研究的关键,考虑时间序列特征点的重要意义,引入一种时间序列波动点的抽取方法,采用二叉特征树结构对原序列进行再表达该方法既提取了序列整体趋势信息,又有效约减了数据维数对多个数据集的层次聚类实验表明,在保证较高准确率情况下,该方法显著提高了的计算效率关键词:数据挖掘;相似度搜索;动态时间弯曲距离;特征抽取;聚类中图分类号:文

2、献标识码:WUHong-jiang,ZHAOJun-ping,PENGOin-ke,HUANGYong-xuan(,’,’,:,:):,,,:;;;;引言征点基于序列特征点的重要意义,本文引入一种特时间序列广泛存在于气象、电力、经济金融等诸征点抽取方法,构造了二叉特征树对原序列进行再多领域采用数据挖掘的方法揭示数据内部规律已表达,并在此基础上采用距离进行相似度匹成为时间序列分析的一个重要研究方向配测试表明,本文方法可以显著提高相似性搜索效[]提出了对大规模时间序列数据库的聚率,且在多个实验中均维持较高的准确率[]相似度距离类算法等针对具有连续时间序列集挖掘[

3、]广泛采用的欧氏距离及其改进对时间轴的变形关联规则,并对股票数据作了性能测试李爱国对在线时间序列提出了一种稳健分割算法以非常敏感,一些轻微的改变会导致欧氏距离发生很[,,,]挖掘序列模式然而无论是分类、聚类还是关联规则大变化其原因是欧氏距离对数据采取无差挖掘,都需要解决时间序列的相似度问题,相似性搜别的一一对应计算策略,动态时间弯曲的相似距离[,]可以弥补欧氏距离缺陷索是时间序列数据挖掘的研究基础由于时间[]序列存在各种复杂变形(如平移、伸缩、间断等),且最早用于语音处理方面等首先变形时间和变形程度都无法预料,传统的欧氏距离将其引入到数据挖掘领域与欧氏距离的

4、一一对应已经无法胜任目前,动态时间弯曲()相似距计算不同,它通过计算弯曲路径上选择的匹配点间离的稳定性已在国内外得到验证[],但的计的距离表征序列的相似度算复杂性限制了其进一步应用给定两条时间序列X=(x,x,⋯,xi,⋯,xm)时间序列数据量大,最值得关注的往往是其特和Y=(N,N,⋯,Nj,⋯,Nn),构造m>n的矩阵d=收稿日期:;修回日期:基金项目:国家自然科学基金项目()作者简介:武红江(—),女,西安人,博士生,从事数据挖掘及应用的研究;彭勤科(—),男,陕西凤翔人,教授,博士生导师,从事数据挖掘及应用、实时并行信息处理与控制系统等研究第期武红江

5、等:基于波动特征的时间序列数据挖掘((,)),元素(,)表征序列点对(,)间的键段或关键点例如股票技术分析中的头肩顶形态,距离可以通过少数几个特征点来表征,如图所示定义1(弯曲路径)在距离矩阵中,定义序列,间连续的二元匹配关系组的集合为,其中(,),,,是路径长度,即(,,⋯,⋯,),图2头肩顶形态及其特征点(,)()本节给出一种基于序列波动情况的特征点提在所有弯曲路径集中,最关心的是序列相似取方法程度最大(距离值最小)的弯曲路径因此有如下定定义3时间序列(,,⋯,,⋯,),义:定义在某一尺度上的波动特征点为,且有定义2序列,的相似度(,)为弯曲路{()((

6、)),径中距离最小值计算公式为,,⋯}()(,)(()其中()为到序列端点间连线的距离且)算法对时间序列具有很强的适应性[,],()(())包括处理各种时域和幅度的变化然而经典算如图所示,点即为该序列特征点将序法复杂度为(),在改善计算速度方面学者做了列分为两部分一般而言,若特征点(记为)将[]很多研究工作目前常用的方法是等提出的分为前后两段子序列(,⋯,,⋯,)和技术,它通过设置计算窗口(如图所(,⋯,,⋯,),则通过递归调用定义分别确示)的方法得到目标下限,即只计算窗口内对应的定和的特征点和,依次进行直到子序列相似距离,从而尽量避免无谓的计算文献长度小于

7、,从而得到特征点序列[]则通过局部极点线性分段的方法来约减维数,(,,⋯)从而提高了计算效率图3特征点计算显然,它表征了特征点的计算粒度的大小可以根据序列长度和要求图1Sakoe-chiba计算窗口(带状区域)灵活设定本文取,即子序列长度此外,从的构造与实现角度来看,其搜索如果小于,则停止提取特征点方向为整体向前行进,缺乏一种依据全局形态进行易知,上述分层递归提取的过程也是一个快速匹配的机制,尤其是当两条序列长度差异过大[]二叉树的构造过程因此本文考虑将特征点以二叉时,容易产生病态弯曲路径树结构实现,便于灵活调整和管理无论是设置计算窗口还是采用极点分段,其目

8、定义4(二叉特征树)首先是个二叉的是在保证一定准确率

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。