欢迎来到天天文库
浏览记录
ID:46292178
大小:412.46 KB
页数:7页
时间:2019-11-22
《基于主成分分析的单变量时间序列聚类方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第20卷第6期2叭1年12月运OPERATlONS筹与管理RESEARCHANDMANAGEMENTSCIENCEV01.20.No.6Dec.2011基于主成分分析的单变量时间序列聚类方法苏木亚,郭崇慧(大连理工大学系统工程研究所.辽宁大连116024)摘要:针对时间序列数据的高维特性,在进行理论分析的基础上,利用主成分分析法提出了一种单变量时间序列数据降维的新方法,进而提出了基于主成分分析的单变量时间序列聚类方法。其主要思想是在线性空间中的同一组基下,用系数之间的相似性来刻画对应时间序列之间相似性,在理论分析过程中,首先对单变量时间序列数据集进行主成分分析。其次分析了单
2、变量时间序列数据集、样本协方差矩阵的特征向量与主成分之间的关系,并证明了由主成分构成的向量组线性无关。为了进一步验证理论分析结果的正确性和所提算法的有效性,分别利用仿真数据和真实的股票数据进行了数值实验。关键词:多元统计分析;单变量时间序列;主成分分析;聚类分析中图分类号:0212.4文章标识码:A文章编号:1007—322l(2011)06·0066-07UniVariateTimeSer.eSCIuster.ngMethOdBasedOnPr.ncipaICOmpOnentAnaIySlsSUMu—ya,GUOChong-hui(肌s胁“纪矿s弘抛册E哂乃eer啦’,D
3、aZ如厅‰溉”渺0,死c^noJ[Dgy,Da舰凡116024,C^i册)Abstract:Fortheh培hdimensionalityoftimeseries,basedontheoreticalanalysi8,anewmethodi8pmposedtoreducethedimensionofuniVariatetimeserie8Viaprincipalcomponentanalysi8,thu8uniVariatetimeseriesclus.teringmethodbasedonprincipalcomponentanalysisispresented.Them
4、ainideaisthat,similaritiesamongtheuniva“atetimeseriesarerenectedbysimilaritiesamongthecorrespondingcoe伍cientsunderthesamebasicvec·torsoflinearspace.Intheprocessoftheoreticalanalysis,wenrstIydotheprincipalcomponentanaly8isonuni—Variatetimese“esdata8etsandthen8nalyzetherelationshipamonguniva
5、riatetimeseries,eigenVectorsofsam—plecoVariancematrixandprincipalcomponent8.Moreo、,er,weproveth8ttheVecto娼composedofprincipaleom—ponentsarelinearindependent.Inordertofurtherverifythecorrectne8softheoreticalanalysi8resultsandtheperfb皿anceoftheproposedalgorithm,simulationdataandrealstockdata
6、areusedtodothenumericalexperi—mentsfinally.KeywOrds:uniVariatetimeseries;principalcomponentanaly8i8;chlsteranalysi8O引言时间序列数据是一种非常重要的高维数据类型。与静态数据不同,时间序列数据的属性值随时间的变化而变化。对时间序列数据进行分析和挖掘能够为众多领域提供有价值的信息,时间序列聚类分析是时间序列数据挖掘中的重要任务之一,广泛应用于工程、金融和商业等领域。文[1]将已有的时间序列聚类方法分为三大类:基于原始数据集的聚类、基于特征的聚类和基于模型的聚类。基
7、于原始数据集的聚类收稿日期:2010-05-18基金项目:国寥自然科学基金资助项目(10571018.70871015);国家高技术研完发展计划(863计划)资助项目(2008AA042107)作者简介:苏木亚(1983-).男。蒙古族.博士研究生.研究方向为教据挖掘与商务智能;郭崇慧(1973·).男.博士.教授。博士生导师,研究方向为系统优化方法、数据挖掘与机器学习。第6期苏木亚,等:基于主成分分析的单变量时间序列聚类方法67由于时间序列数据的高维特性,致使算法的时间复杂度和空间复杂度很高,这限制了基于原始数据
此文档下载收益归作者所有