主成分分析和因子分析在评价区域经济发展水平中的应用

主成分分析和因子分析在评价区域经济发展水平中的应用

ID:14228162

大小:146.50 KB

页数:7页

时间:2018-07-27

主成分分析和因子分析在评价区域经济发展水平中的应用_第1页
主成分分析和因子分析在评价区域经济发展水平中的应用_第2页
主成分分析和因子分析在评价区域经济发展水平中的应用_第3页
主成分分析和因子分析在评价区域经济发展水平中的应用_第4页
主成分分析和因子分析在评价区域经济发展水平中的应用_第5页
资源描述:

《主成分分析和因子分析在评价区域经济发展水平中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、!!塑!至箜!塑!塑垡笪堡型兰主成分分析和因子分析曼鱼塞翌窒在评价区域经济发展水平中的应用●贾万敬何建敏摘要:文章从主成分分析、因子分析的发展过程、基本原理.应用等方面出发来全面地介绍多元数据处理的主要方法。文章以江苏省各地市经济发展水平为例,根据江苏省各市2005卑的国民经济主要统计指标,利用SPSS软件赴理的结果来说明上述方法在评价江苏省各地市的经济发展水平中的应用。关键词:主成分分析;因子分析;区域经济一、引言我国是一个经济与社会发展水平.资源与环境禀赋情况在各区域间差异非常大的国家。自科学发展观提出以来,区域经济协调发展的研究得到了充分的重视。要制订出促进区域经济协调发展的有效

2、政策,首先.必需对区域经济发展的水平做出合理的评价。从中找出形成区域经济发展水平差异的关键因素。主成分分析和因子分析是多元统计中十分常用的两种方法,本文将着重介绍这两种方法的基本原理、数学模型以便从根本上揭示出这两种方法的区别。本文还将介绍主成分分析和因子分析的发展历程和应用领域。结台江苏省区域经济发展的现状,选取反映2005年江苏省13个地级市经济发展水平的12个主要统计指标。运用因子分析方法对江苏省辑地级市的经济发展的基本状况进行综合评价。二、分析方法简介统计推断的理论工作大多数都是基于总体为多元正态的假定,然而在高于一维的情况下,要说明一组样本来自多元正态总体是非常困难的,而且多个变

3、量使用的测量单位也可能各不相同或者变量闻的数值大小相差很大。因此,要对多元数据进行处理,通常将初始变量标准化。1.主成分分析。(1)主成分综台评价的产生和发展。主成分分析(PrincipleComponentAnalysis)的概念最早在1901年由皮尔逊(KarlPealton)首先引人.对非随机变量讨论,1933年数学家霍特林(Hotelling)把它推广到随机向量。JollifeI.T和J.EdwardJackson对主成分分析进行了较为系统地分析和阐述,而郭_i|91军教授系统地论述了综合评价的理论和方法,虽然目前还没有关于主成分综合评价方法的专著.但很多专家学者对其进行了探讨和研

4、究。一些学者M不同的角度提出PICA的稳健性问题,对此进行了研究,并且提出了各自的改进算法。有学者提出丁独立主成分分析(IPCA)的概念,弓1人非线性PCA算法。也有学者从如何去除或减弱有限的样本集中少量“劣点”样本的影响从而获得准确主方向。常用的主成分分析是从样本协方差矩阵来计算 的.而协方差矩阵对劣点值相当敏感,为了增强主成分分析的稳健性,对协方差进行算法改进,从而提高主成分分析的稳健性。主成分综合评价应用中也存在很大争议,有的学者就提出了究竟应选取多少个主成分来对样本进行排序的问题。一般来说,主要有两种观点:一是只用第一主成分,英国统计学家肯德尔认为:第一主成分能够最大限度地反映样

5、本间的差异.是概括指标差异信息的晟佳线性函数。因此.只能用第一主成分对样本综合排序。我国也有部分学者持这种观点.南开大学盂生旺老师从几何投影角度阐明.在多指标综合评价中,只有第一主成分结合原始数据的信息最多,因而也就只能以第一主成分值作为综合评价值才合理。另一种观点则认为,不仅要充分重视第一主成分.而且也要顾及其它主成分在综台评价中所起的作用,否则.损失的信息较多,有时甚至回歪曲样本间的实际相对地位。提出的改进办法是:先按累积方差贡献率不低于某个棚值(比如85%)的原则确定前几个主成分,然后以每个主成分各自的贡献率为权数将选定主成分线性加权求和来综合评价样本的优劣。(2)主成分分析的原理。

6、主成分分析是一种通过降维技术把多个变量把多个变量化为少数几个主成分的统计分析分析方法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线形组台。当原来P个变量的总变差能够由少数几个线形组合来概括的话.那么这些线形组合中包含的信息与原来P个变量几乎一样多.可以用这些线形组合替代原来的P个变量,这样会是观测数据从高维降到低维,简化了数据。主成分就是P个变量Y。。Y:,…,L的一些特殊线形组合,这些线形组合把Y,,Y:,…,Y。构成的坐标系旋转产生新的坐标系,在新坐标系中提供了协差阵的简洁表示。以X.(i=1,2,…,p)表示标准化的原变量,z.(i_1,2,…,p)表示主

7、成分,ci(江l,2,…,P;j=1.2,…,p)表示组合系数,主成分分析的模型为:ZFCIlXl+ClⅨ汁・|+ClXZr=%Xl+C冰2+…+C磷。一19—!垒窒翌窒!塑垡笪翌型堂!!!!!堡翌!塑zp=cplxl+c≯2+¨u65291Xc^(3)主成分分析的应用。主成分分析一般不是目的,而足研究的某个巾间环节.通过这一处理来发现重要的变量和变量间的某种关系。在网于分析法中,通常用主成分分析法来确定公共网子。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。