欢迎来到天天文库
浏览记录
ID:59201416
大小:236.17 KB
页数:5页
时间:2020-09-10
《应用多元分析主成分分析作业.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、应用多元分析——主成分分析6.1试述主成分分析的基本思想。 答:在处理多指标变量问题的过程中,由于多个变量之间往往存在着一定程度的相关性,人们可以通过线性组合的方式,从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合继续这个快速提取的过程,如此继续下去,直到提取的信息与原指标差不多时为止,这就是主成分分析的基本思想。6.5试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的,而实际表明,这种差异有时很大。根据协方差矩阵进行主成分分析的,其结果受变量单位的影响。不同的变量往往有不
2、同的单位,对同一变量单位的改变会产生不同的主成分,主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用R代替∑,在采用R代替∑后,可以看作是用标准化的数据做分析,而且在研究单位变量大都不统一的经济问题是,会使得主成分有现实经济意义,不仅便于剖析实际问题,又可以避免突出数值大的变量。6.6已知X=(X1,X2,X3)’的协差阵为113/23/23/221/453/43/253/431/4试进行主成分分析。解:令
3、-λE
4、=11-λ-λ-λ=0计算得-6
5、4(λ-4)(λ-8)(λ-12)=0即特征值分别为λ1=12,λ2=8,λ3=4所以DY1=12,DY2=8,DY3=4当λ1=12时,(-λE)=---17经过一系列的初等行变换可化为10-203-1000则特征向量为α1=23,1,3’同理,当λ2=8时,α2=(-2,3,3)’当λ3=4时,α3=(0,-3,1)’易知α1,α2,α3相互正交,通过单位化向量可得T2=α1
6、α1
7、=32,14,34’,T2=α2
8、α2
9、=-12,34,34’,T3=α3
10、α3
11、=0,-32,12’而Y1=T1'X,Y2=T2'X,Y3=T3'X所以,带入数据可得第一主成分为Y1=32X1+1
12、4X2+34X3,DY1=12第二主成分为Y2=-12X1+34X2+34X3,DY2=8第三主成分为Y3=-32X2+12X3,DY3=46.7设X=(X1,⋯,Xp)’的协方差阵(p×p)为Σ=σ21ρ⋯ρρ1⋯ρ⋮⋮⋱⋮ρρ⋯1,0
13、ρσ20σ21-ρ-λ⋯ρσ2⋮⋮⋱⋮0⋯0σ21-ρ-λ=0=p-1ρσ2+σ2-λ[λ-(σ21-ρ)p-1]又0<ρ<1,则特征值分别为λ1=[1-1-pρ]σ2,λ2=σ2(1-ρ)而λ1-λ2=pρ>0则λ1=[1-1-pρ]σ2为最大特征根当λ1=[1-1-pρ]σ2时,Σ-λ1E=σ2ρ1-pρσ2⋯ρσ2ρσ2σ2ρ(1-p)⋯σ2ρ(1-p)⋮⋮⋱⋮ρσ2ρσ2⋯σ2ρ(1-p)=01⋯000⋯0⋮⋮⋱⋮00⋯0所以特征向量为α1=1,1,…,1’通过标准化可得T1=1p,1p,⋯1p’即证得,Y1=1ρi=1pxi6.8通过对各地区的六个指标进行主成分分析,然后
14、对各地区城市设施水平进行综合评价和排序。解:将原始数据输入spss编辑窗口,将六个变量分别命名为X1~X6,在spss窗口选择Analyse→DataReduction→Factor菜单项,调出因子分析界面,并将六个变量移入Variable框中,其他均保持系统默认选项,单击ok按钮,执行因子分析过程,如下图所示。得到特征根和方差贡献率表(表一)和因子载荷阵(表二)TotalVarianceExplainedComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%Tota
15、l%ofVarianceCumulative%12.15535.91735.9172.15535.91735.91721.56626.09362.0101.56626.09362.01031.23020.50782.5171.23020.50782.5174.61710.28092.7975.2584.29997.0966.1742.904100.000ExtractionMethod:PrincipalComponentAnalysis.表一ComponentMat
此文档下载收益归作者所有