《统计手册:金融中的统计方法》 第章 主成分分析和因子分析

《统计手册:金融中的统计方法》 第章 主成分分析和因子分析

ID:15153863

大小:182.50 KB

页数:19页

时间:2018-08-01

《统计手册:金融中的统计方法》 第章 主成分分析和因子分析_第1页
《统计手册:金融中的统计方法》 第章 主成分分析和因子分析_第2页
《统计手册:金融中的统计方法》 第章 主成分分析和因子分析_第3页
《统计手册:金融中的统计方法》 第章 主成分分析和因子分析_第4页
《统计手册:金融中的统计方法》 第章 主成分分析和因子分析_第5页
资源描述:

《《统计手册:金融中的统计方法》 第章 主成分分析和因子分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《统计手册:金融中的统计方法》第16章主成分分析和因子分析《统计手册:金融中的统计方法》第16章主成分分析和因子分析C.RadhakrishnaRao1.引言主成分分析和因子分析(principalcomponentandfactoranalysis,PCA和FA)是用于研究个体测量指标的协方差(或相关)结构的探索性多元技术。分析的目标可以不同:找出若干可以解释可观测指标之间的变差或者联系的潜变量而简化高维数据,对相似指标进行分组及检测多重共线性,将高维数据在低维空间中图示以直观考察数据的散布情况及检测异常值。PCA是由Pearson(1901)和

2、Hotelling(1933)发展起来的;Rao(1964)给出了基本原理及一些扩展和运用。FA首先由Spearman(1904)提出,接着Lawley(1940)在多元正态性的假定下发展。Rao(1955)给出了没有任何分布假设的FA的原理,命名为典型因子分析(CFA)。现在已经有许多优秀的、大部的专著致力于社会科学和自然科学研究中PCA和FA的计算及使用问题。参考文献包括Bartholomew(1987),Basilevsky(1994),Cattel(1978),Jackson(1991),和Jolliffe(1986),这里仅提到少数作者。

3、当测量指标是定性指标时,和PCA有关的一种方法称为对应分析(correspondenceanalysis,CA),是Benzecr(i1973)基于Fisher(1936)提出的定性尺度范畴(scalingqualitativecategories)方法而发展起来的。Greenacre(1984)的专著阐述了CA的理论及其在列联表分析中的应用。Rao(1995)的论文包含了CA的一种替代方法,和CA的用途一致,但看起来优于早期方法。本文将提供某些最新理论成果和实际应用以全面考察PCA和FA。2.主成分2.1.一般问题主成分问题可以用如下非常一般的步

4、骤进行阐述。令x是一个p维向量,y是一个q维向量,其中x和y的一些分量可能是相同的。我们要用z=Ay代替y,其中A是一个r×q矩阵且r<q,使得用z代替y预测x的损失尽可能小。如果∑∑????1112????(2.1)????∑∑??2122??是x和y的协方差矩阵,那么用z=Ay预测x的误差的协方差矩阵就是??1W′′=∑??∑A(A∑A)A∑(2.2)11122221我们选择A,使得W对一个适当选择的标准而言是小的。如果选择W=trW,那么最优选择是??1′′A=argmaxtr∑A(A∑A)A∑??122221A最大值在1《统计手册:金

5、融中的统计方法》′A=(C:L:C)(2.3)??1r222时达到,其中C,L,C是∑∑关于∑的前r个特征值λ≥λ≥L≥λ所对应的r个1r21122212r特征向量,也就是说,特征向量和特征值是从下面的行列式方程中产生的2∑∑-λ∑=0(2.4)211222用z=Ay预测x的相对信息损失是??????1′′tr(∑??(A∑A)A∑∑A)/tr∑11??22????2112??1122(2.5)λ+L+λ1r=1??tr∑11我们可以选择一些特殊的x和y,并导出具有(2.3)形式的最优变换A。2.2.x=y的情形''考虑特定情形

6、x=y,得到一般主成分Cx,L,Cx,其中C,L,C是行列式方程1r1r22∑??λI=0的前r个特征值λ≥L≥λ所对应的前r个特征向量。在这种情况下,信息111r损失(2.5)等于2222λ+L+λλ+L+λr+1p1r1??=(2.6)2222λ+L+λλ+L+λ1p1p通常用百分数表示,r的选择取决于(2.6)的大小。2实际上,需要从p维随机向量x的n个独立观测值样本中估计λ和C,这个样本用iip×n矩阵表示X=(x:L:x)(2.7)1n∑的估计量是111??1????′′S=(n??1)XI??eeX????n????其中e是n维1向量。

7、λ的估计l和C的估计量c可以从谱分解中得出iiii22′′S=lcc+L+lcc(2.8)111ppp于是第i个个体观测值的主成分就是′′′q=(cx,L,cx)(2.9)i1ipi其结果是,我们表示s=S的第i个对角线元素,ii2《统计手册:金融中的统计方法》′c=(c,L,c),j=1,L,p,(2.10.1)jj1jp??c=lc,i=1,L,p,(2.10.2)jijji′q=(q,L,q),i=1,L,n,(2.11.1)ii1ip??1??q=lq,i=1,L,n.(2.11.2)ijjij应该注意,向量c和q(除坐标平移之外)可以从奇

8、异值分解(singularvalueiidecomposition,SVD)1????′′′XI??ee=lcd+L+lc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。