资源描述:
《主成分分析在多维股票数据处理中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第26卷第8期增刊仪 器 仪 表 学 报2005年8月X主成分分析在多维股票数据处理中的应用1123张 哲 李 筠 王怀清 王朔中1(上海理工大学光电学院 上海 200093)2(香港城市大学 香港)3(上海大学 上海 200072)摘要 构成股票市场实时交易数据量的因素众多,同一时刻对于同一股票,往往有多个元素反映股票信息,且其关系错综复杂,如同一股票下对应不同价格有不同的需求股等。在对美国股票市场其中一支股票的多维信息因素进行了主成分分析的方法,检验此降维方法在实时股票数据上压缩信息量的可行性。关键词 多维股票数据 主成分 降维 反变换 检验Stu
2、dyofPrincipalComponentAnalysisonMulti-dimensionStockData1123ZhangZheLiJunWangHuaiqingWangShuozhong1(OptoeletricalInstitute,UniversityofShanghaiforScienceandTechnology,Shanghai200093,China)2(CityUniversityofHongKong,HongKong,China)3(ShanghaiUniversity,Shanghai200072,China)Abstrac
3、tTherearemanyfactorswhichinfluencethestockmarketdataquantity.Inthesametime,therela2tionshipamonginfluencefactorsareintricate.TheprincipalcomponentanalysisonacertainstockaboutAmeri2canstockmarketaredesignedandthefeasibilityincompressinginformationcapabilityisanalyzed.KeywordsMult
4、i2dimensionstockdataPrincipalcomponentanalysisDimensionalityreductionInversetransformAnalysisx11x12⋯x1p[1~3]1 主成分分析的基本原理x21x22⋯x2pX=(1)⋯⋯⋯⋯在实际问题中,经常遇到多变量问题,在多数情况xn1xn2⋯xnp下,不同指标之间是有一定相关性的,这就增加了问题用数据矩阵X的p个向量X1、X2、⋯、Xp作线性组合的复杂性。主成分分析就是设法将原来的指标体系重(即综合指标向量)为:新组合成一组新的、互相无关的综合指标,同时根据实
5、F1=a11x1+a12x2+⋯+ap1xp际需要从中选取几个较少的综合指标尽可能多地反映F2=a21x1+a22x2+⋯+ap2xp(2)原来指标体系的信息。因此,采用主成分分析法可以用⋯来处理降维问题。Fn=an1x1+an2x2+⋯+appxp设有n个样品,每个样品观测p项指标(变量):其中,系数aij,i,j=1,2,⋯,p满足条件:222X1、X2、⋯、Xp,得到原始数据资料阵:a11+a21+⋯+ap1=1。而且要求Fi与Fj(i≠j)不相关;F1是X1、X2、⋯、Xp的一切线性组合中方差最大的;F2是与F1不相关的X1、X2、⋯、Xp的一
6、切线性组合中方X上海理工大学学生创新基金。©1995-2006TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved. 第8期增刊主成分分析在多维股票数据处理中的应用687差最大的;依次类推,Fp是与F1、F2、⋯、Fp-1都不相关表1 协方差矩阵的X1、X2、⋯、Xp的一切线性组合中方差最大的,分别x1x2x3x4x5称为第一、二、⋯、p主成分。选取以协差阵2的特征向x11015201250103-0110量为系数的线性组合作为X1、X2、⋯、Xp的主成分,根x201521015101240103据累
7、计贡献率的大小取前k个主成份。通过挑选前几x301250151101410129个最大的主成分,贡献率越大,表明综合信息的能力越x4010290124014110152强。如果前k个主成分的累计贡献率达到一定的x5-01100103012901521比例,表明取前k个主成分就基本包含了全部测量指表2 特征值及主成分贡献率标所具有的信息,这样既减少了变量的个数又简化主成分特征值贡献率累计贡献率了变量之间的关系,便于对实际问题的分析和研121144218%4218%究。 211452819%7117%301581117%8314%2 主成分分析的计算步骤4
8、0146913%9217%50137713%100%根据上述主成分分析的基本原理,主成分分析计