数据归约方法在时序数据分类中的应用研究

数据归约方法在时序数据分类中的应用研究

ID:36850161

大小:3.46 MB

页数:69页

时间:2019-05-16

数据归约方法在时序数据分类中的应用研究_第1页
数据归约方法在时序数据分类中的应用研究_第2页
数据归约方法在时序数据分类中的应用研究_第3页
数据归约方法在时序数据分类中的应用研究_第4页
数据归约方法在时序数据分类中的应用研究_第5页
资源描述:

《数据归约方法在时序数据分类中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要时间序列数据(TimeSeriesData)广泛地存在我们生活中的各个领域,越来越多的数据挖掘研究者关注于时间序列的挖掘方法和技术,而时间序列的分类是时间序列数据挖掘的重要任务之一。数据归约用来得到数据集的归约表示,比原始数据量小,但仍然近似地保持原始数据的完整性,在归约后的数据集上进行挖掘将更有效,并产生相同或几乎相同的分析结果。时间序列数据往往具有大数据集的特点,所以数据归约成为预处理中不可或缺的步骤,并且直接影响后期分类的准确率,因此,时间序列的数据归约是现阶段时间序列数据分析的重要研究热点。针对时间序列数据归约这一研究热点,本论文以一元时间序列数据为主要研

2、究对象,重点研究适用于分类任务的时间序列数据归约方法。本论文完成的工作主要有:首先,本论文分析了现阶段常用于时间序列分类挖掘的数据归约方法,并归纳为四大类,它们分别是基于基本统计方法的数据归约、基于模型的数据归约、基于变换的数据归约、基于分形维数的数据归约。同时,针对每一类的数据归约方法,进一步研究了与它相适应的分类方法和它在时间序列数据中的应用邻域。其次,将聚类的思想引入到数据归约当中,形成了基于聚类的时间维度归约方法(TimeDimensionalityReductionBasedonCluster,TDRBC)。该方法的基本思想是对时序数据的时间维度进行聚类,聚类使

3、用K一均值算法,提取聚类后的聚类中心作为新的数据集,因而能有效地减少数据量,数据归约后的数据集可直接利用分类方法进行分类。文中称这一方法为基本的TDRBC。再次,在基本的TDRBC基础上,引入信息熵的思想,改进原有算法,形成了基于聚类的自适应时间维度归约算法,简称为自适应的TDRBC。该算法的基本思想是:在时间序列的时间采样点上计算信息熵,根据熵值的大小初始化聚类中心,然后再利用聚类时间维度归约方法进行数据归约。最后,为了验证本论文提出的两种新方法的可行性,本论文设计了一套仿真实验,采用具有代表性的四组数据分别进行数据归约,归约方法除了上述的两种新方法外,实验采用现阶段常

4、用的LPCC数据归约作为参照方法。归约后的数据将进行分类识别,得出分类准确率。实验表明:本论文提出的两种数据归约方法,不仅能够有效地降低数据量,达到数据归约的目的,同时还能提高分类的准确率,并具有很强的实用性。关键词:时间序列;数据归约;分类;聚类;信息熵HAbstractTimeseriesdataareubiquitousintherealworld,andhaveattractedmoreandmoreintereststodiscoveryknowledgebymimngthem.Timeseriesclassificationisoneofthemaintask

5、softimeseriesdatamimng.Sincethevolumesoftimeseriesdatasetsareusuallyhuge,datareductionisallabsolutelynecessarypreprocessingstep,andCalldirectlyinfluenceontheaccuracyoftheclassificationalgorithms.Therefore,datareductionisallactiveandhottopicintimeseriesdataminingsociety.Focusingonthetaskof

6、univarianttimeseriesclassification,Oursolutionistimedimensionalityreductionbasedoncluster(TDRBC),whichintegratesthetechnologyofclusteringintodatareduction.Ourmainworkconsistsofthefollowingaspects:First,analysiscurrentdatareductionmethodsoftimeseriesdataminingandinducefourcategories,theyar

7、edatareductionbasedonbasicstatisticalmethods,datareductionbasedonmodel,datareductionbasedontransformation,datareductionbasedonfractaltheory.Atthesametime,foreverycategory,furtherresearchitsclassificationmethodsanditsapplicationintimeseriesdataneighborhood.Secondly,t

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。