欢迎来到天天文库
浏览记录
ID:52458303
大小:661.37 KB
页数:15页
时间:2020-03-27
《主成分回归分析(PPT).pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、主成分回归分析一、主成分估计主成分估计是以P个主成分中的前q个贡献大的主成分为自变量建立回归方程,估计参数的一种方法。它可以消除变量间的多重共线性。ybbxbxbxe回归方程01122pp对各变量进行标准化处理Y*X*e对于解释变量X*,使得z=X*UY*X*eX*UUe令UY*ZeY*Ze(c1,2,...,q)ccY*ZZ...Z1122qq1ˆZZZY*ccccn11zi1yi*1z1y*11
2、i1zn22y2*2zy*i2ii1zynqqnqziqyi*i1nzi1yi*/1i1zi2yi*2ziqyi*qnˆjzijyi*ji1UUˆUˆˆUˆUˆUcc1122qq1、给定c,q1qjpc,jpcj1j12、删去0.01的特征根所对
3、应的主成分。q13、5qj1jSPSS实现1、对所有变量进行标准化(Analyse-description)2、对所有标准化后的自变量求主成分Z(factor)3、选择前几个主成分4、计算主成分得分(transform-compute)5、y与主成分进行回归(analyse-regression),求出α系数值。6、compute,Uˆ求出β系数,即可得出消除多重共线性的标准回归方程。例3.9经济工作者希望通过国内总产值x1,存储量x2,消费总量x3,去预测进口总额y,为此收集了某地区共计十一年的有关
4、数据,利用主成分估计建立回归方程。(数据见spssex/ex309)Z1=0.7066*zx1+0.0435*zx2+0.7066*zx3Z2=-0.0357*zx1+0.9990*zx2-0.0258*zx3yˆ*0.690z10.191z2例3.10影响电的需求量的指标有:(1)钢的产量x1;(2)生铁产量x2;(3)钢材产量x3;(4)有色金属产量x4;(5)原煤产量x5;(6)水泥产量x6;(7)机械工业总产值x7;(8)化肥产量x8;(9)硫酸产量x9;(10)烧碱产量x10;(11)棉纱产量x11共
5、11个指标。收集了23年的指标值,建立发电站需求模型。(数据见spssex/ex310)Z1=0.3145*zx1+0.3027*zx2+0.3100*zx3+0.2782*zx4+0.2518*zx5+0.3110*zx6+0.3116*zx7+0.3075*zx8+0.3034*zx9+0.3145*zx10+0.3050*zx11Z2=-0.0522*zx1+0.2949*zx2-0.0469*zx3+0.3696*zx4+0.7199*zx5-0.1919*zx6-0.1391*zx7-0.2421*zx8
6、-0.3361*zx9-0.1481*zx10-0.0536*zx11二、主成分分析筛选变量法1、将原始样本数据标准化后,作主成分变换Z=X*UUuuup1p2ppp2、剔除Up中绝对值最大的ui1p所对应的变量具有较小特征根对应的主成分含有较少的信息。3、将剩余p-1个标准化变量X*(1)再作主成分分析Z(1)=X*(1)U(1)4、再考虑最小特征根对应的特征向量,找出绝对值最大的特征向量,剔除与之对应的变量。直至满足给定条件时停止。5、将因变量与剩余变量作回归三、主成分回归法先将原始变量作主成分估计,
7、得到标准化后的y与主成分的回归方程。离差平方和分解:*2**2*2yiyyiyˆiyˆiy*2**2*2yiyiyˆiyˆi*2**yˆiYˆYˆZˆZˆˆZZˆˆˆ1ˆ1ˆˆˆˆ2212ppˆpˆ1ˆpˆˆˆ2ˆ2ˆ2ˆ2ˆ21122pp1122ppj
8、jj1ˆp2ˆ任一构成jj是主成分Zj对Y*的偏回归平方和。找出偏回归平方和最小的主成分,其系数向量中,最大的U所对应的自变量被ij剔除。找出次小的偏回归平方和,类似做之最后将y*与剩下自变量做回归。推荐阅读期刊名及期数论文题目财经研究2002.1我国各地区城镇居民消费性支出的分析研究数量经济技术经济研我国上市公司盈利能力与资本
此文档下载收益归作者所有