基于主成分分析和聚类分析的我国各省市经济效益研究

基于主成分分析和聚类分析的我国各省市经济效益研究

ID:42025641

大小:992.50 KB

页数:31页

时间:2019-09-06

基于主成分分析和聚类分析的我国各省市经济效益研究_第1页
基于主成分分析和聚类分析的我国各省市经济效益研究_第2页
基于主成分分析和聚类分析的我国各省市经济效益研究_第3页
基于主成分分析和聚类分析的我国各省市经济效益研究_第4页
基于主成分分析和聚类分析的我国各省市经济效益研究_第5页
资源描述:

《基于主成分分析和聚类分析的我国各省市经济效益研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于主成分分析和聚类分析的我国各省市经济效益研究姓名:学号:学院:班级:2008.03指导教师:内容前言主成分分析聚类分析实例分析前言本文对主成分分析和聚类分析的基本理论知识进行了阐述,然后利用主成分分析法对描述我国工业企业的原始经济指标进行降维,求得几个综合指标,借助这几个综合指标对各企业经济效益进行评价研究,最后根据综合指标建立一个最终的评价指标,借助该指标对全国28个主要省、市、自治区的独立核算工业企业的经济效益做出排名,最后借助聚类分析对之进行了分类。主成分分析原理及思想:主成分分析就是将众多具有一定相关性的指标(p个指标),重新组合成一组相互

2、无关的几个综合指标来代替原来的指标。通常数学上的处理就是将原来的指标做线性组合,作为新的综合指标。主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。主成分分析主成分分析的基本理论设对某一事物的研究涉及个p指标,分别用表示,这个p指标构成的p维随机向量为。设随机向量X的均值为,协方差矩阵为。对X进行线性变换,可以形成新的综合变量,用Y表示,也就是说,新的综合变量可以由原来的变量线性表示,即满足下式:主成分分析为了取得较好的效果,我们总是希望的方差尽可能大且各之间互相独立,由于而对任给的常数c,有因此对不加限制时

3、,可使任意增大,问题将变得没有意义。我们将线性变换约束在下面的原则之下:主成分分析1、,即2、、相互无关3、的一切满足原则1的线性组合中方差最大者;是与不相关的所有线性组合中方差最大者;…,是与都不相关的的所有线性组合中方差最大者。主成分分析基于以上三条原则决定的综合变量分别称为原始变量的第一、第二、…、第p个主成分。其中各综合变量在总方差中占的比重依次递减,在实际研究工作中,通常只挑选前几个方差最大的主成分,从而达到简化系统结构,抓住问题实质的目的。聚类分析原理及思想:聚类分析将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更

4、强。样品或指标(变量)之间存在着程度不同的相似性(亲疏关系),根据一批样品的多个观测指标,找出一些能够度量样品或指标之间的相似程度的量,以这些量为划分类型的依据,把相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另外一类,…。聚类分析关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的样品(或指标)都聚合完毕,形成一个由小到大的分类系统。最后再把整个分类系统画成一张分群图(又称谱系图),用它把所有的样品(或指标)间的亲疏关系表示出来。聚类分析可以用来对案例进行分类,也可以用来对变

5、量进行分类。聚类分析有多种方法,下面主要介绍聚类分析中最常用的系统聚类法。聚类分析系统聚类法的几种常用方法:最短距离法就是类与类间距离采用最短距离法的系统聚类方法。最长距离法是类与类间距离采用最长距离法的系统聚类法。重心法是类与类之间的距离就用重心之间的距离来代表的系统聚类方法。类平均法有两种形式,一种是组间联结法,另一种是组内联结法。类平均法是聚类效果较好、应用比较广泛的一种聚类方法。本文最后的聚类分析就是以类平均法进行的。实例分析实例简述:在企业经济效益的评价中,设计的指标往往很多。这里涉及9项原始指标,包括百元固定资产实现值等。为了简化系统结构,

6、抓住经济效益评价中的主要问题,我们由原始数据矩阵出发求主成分。选取我国28个省、市、自治区独立核算的工业企业,对其经济效益进行评价,原始数据见下表实例求解首先利用SPSS将原始数据标准化通过SPSS将标准化后的数据进行计算得相关系数矩阵部分变量间具有一定的相关性,因此适合做主成分分析。主成分表前两个主成分的方差累积贡献率达到84.7%碎石图在第二个主成分处特征值开始趋于平稳公因子方差除了x5,两个主成分提取了原来指标的绝大部分信息,进一步说明提取两个主成分的合理性。成份矩阵Y1与x1、x2、x3、x6、x7、x8、x9的相关系数最大,因此Y1主要综合了

7、x1、x2、x3、x6、x7、x8、x9的信息Y2主要综合了x4、x5的信息主成分系数表由主成分系数表得到两个主成分的表达式为:Y1=0.375555x1+0.393392x2+0.375252x3+0.093533x4+0.174557x5+0.372146x6+0.361613x7+0.351313x8+0.362591x9Y2=-0.2595x2+0.13437x2+0.265284x3+0.711303x4+0.491309x5-0.16495x5-0.22539x6-0.05236x7-0.05236x8-0.12675x9对所选主成分做经济

8、解释:第一主成分的线性组合中除了100元工业总产值实现利税和100元销售收入实现利税外,其余变

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。