欢迎来到天天文库
浏览记录
ID:33423142
大小:2.87 MB
页数:71页
时间:2019-02-25
《主成分分析与二维主成分分析之比较研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据学位论文原创性声明声明:本人所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。尽我所知,除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:襄敝碑日期:如1l侔媚I器日学位论文版权使用授权书本人完全了解云南财经大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文和论文电子版,允许学位论文被查阅或借阅;学校可以公布学位论文的全部或部分内容,可以采用影印
2、、缩印或其他复制手段保存、汇编、发表学位论文;授权学校将学位论文的全文或部分内容编入、提供有关数据库进行检索。(保密的学位论文在解密后遵循此规定)论文作者签名:昊敢竿导师签名:起建锋日期:Ⅺ坼年朗l留日日期:如ll降岁月囝日万方数据摘要
3、IIlllllrllllllllllllMIIIIIIIllllllll[dlllJY2669614数据降维具有重要的意义,一方面高维数据无法在一些具体的算法中直接应用,降维可以解决“维数灾难”,降低数据复杂度,使一些算法可以正常使用;另一方面高维数据往往包含了大量的噪声和冗余,降维提炼出高维数据中人们感兴趣的数据结构呈现在
4、低维空间中,以便更好地认知和理解研究对象。主成分分析(PCA)和二维主成分分析(2DPCA)是两种不同的降维方法,均可用于对矩阵型数据进行降维。本文就两种重要的矩阵型数据:多元时间序列数据和高频金融数据,比较研究PCA和2DPCA这两种方法的表现,以期对涉及这两种数据的实际应用产生一些借鉴作用。在多元时间序列数据的分类问题中,往往先通过降维方法对数据降维,再在低维空间中进行分类。为此,本文比较了PCA和2DPCA两种降维方法与欧式距离结合后的分类表现。此外,鉴于欧氏距离会受到量纲的影响,本篇论文提出2DPCA在二维主子空间上的马氏距离算法,并在5个真实世界多
5、元时间序列数据集上与欧式距离的结果以及PCA的马氏距离结果进行全面比较,研究发现2DPCA在二维主子空间中的马氏距离是最佳的降维方法和分类距离的组合。在高频金融数据的统计建模问题中,预测资产收益率的波动率具有重要的研究意义。对于包含多个资产的高频金融数据来说,每个交易日存在一个波动率的协方差矩阵,这样的矩阵往往具有较高的维度,如果直接预测波动率会产生大量的参数,所以预测波动率首先需要对高维矩阵进行降维,再对低维矩阵进行预测建模。本文对PCA和2DPCA这两种降维方法进行实证比较研究,用AR、ARMA、ARIMA等6个时间序列模型进行预测。实证研究结果表明,用
6、2DPCA进行降维得到的低维数据,配合以上各个时间序列模型进行预测,都比PCA降维后的数据有更好的预测效果。同时也发现2DPCA降维与VAR模型的组合是最佳的,最终计算出的平均重构误差最小。关键词:主成分分析;二维主成分分析;欧氏距离;马氏距离:高频数据万方数据AbstractDimensionreductionisveryimportant.Ononehand,highdimensiondataCannotbeuseddirectlyinsomepracticalalgorithms,whiledimensionreductionishelpfultoso
7、lvetheproblem,whichiscalled'dimensionCUl"se’,byreducingthecomplexity.Thensomealgorithmswillwork.Ontheotherhand,hi曲dimensiondatausuallyincludesagreatdealof’noise’and'redundancy'.Dimensionreductionhelppeoplefindinterestingdatas缸1lCnlreinlowdimensionspaceforunderstandingresearchobject
8、betterandbetter.PCAand2DPCAaretwodifferentmethodsforreducingdimensionOnmatrixdata.ThispaperwillcomparePCAand2DPCAinresearchingtwokindsofimportantmatrixdata:multivariatetimeseriesdataandhigh-frequencyfinancialdata.Thenwecanusethetwokindsofdataforreferencetopracticalapplication.Inthe
9、classificationproblemofmul
此文档下载收益归作者所有