因子分析与聚类分析案例

因子分析与聚类分析案例

ID:43398880

大小:389.75 KB

页数:15页

时间:2019-10-02

因子分析与聚类分析案例_第1页
因子分析与聚类分析案例_第2页
因子分析与聚类分析案例_第3页
因子分析与聚类分析案例_第4页
因子分析与聚类分析案例_第5页
资源描述:

《因子分析与聚类分析案例》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、1因子分析与聚类分析理论简介1.1因子分析法因了分析法是一种通过分析多个变量间协方差矩阵(或和关系数雉阵)的内部依赖关系,找出能代表所有变量的少数儿个随机变量的计量分析方法。其屮,找出的几个随机变量是不可测量的,将其称为公因子。每个公因子Z间是互不相关的,所有变量都可以由这几个公因子的线性表示。因子分析通过减少变量的数目,用少数因子代替所有变量去分析整个经济问题,人人简化了现实分析过程。假设有N个样本,P个指标,X=(XPX2,.-.,XPy是随机向量,需要寻找的公因子是f=(F,F2,「fJ,则将模型X1=a\F+。

2、12尸2+…+d愉化+£1X2~a2F+。22笃几+6*2Xp=a声+ap2F2+…+apmFm+£p称为因子模型。将矩阵A=(aij)称为因子载荷矩阵,将勺称为因子载荷(Loading),因子载荷的实质是公因子Fi与变量Xj的相关系数。其中,£为特殊因子,代衣公因子以外的影响因素,在实际分析时一般忽略不计。对于需要求出的的公因子,其实际含义取决于该公因子在哪些变量上有较人的载荷。但一般情况下,初始因子模型的因子载荷矩阵都比较复杂,不利于因子的解释。因此可进一步通过因子旋转,给出对各公因子更加合理明显的解释。公因子求出后

3、,可以进一步用冋归估计等方法求出各个公因子得分的数学模型,将其表示成变量的线性形式,从而计算求出得分。模型如下:+bi2X2+--+binXn(i=L2,•…m)1.2层次聚类法聚类分析的实质是按照距离的远近将数据分为若干个类别,以使得类别内数据的“差异”尽可能小,类别间的“差异”尽可能人。“差异”的描述是通过距离或相似性的方法来描述。在统计学中最常用的是距离表达式欧儿里得距离,对于两条数据(州,”,ZJ和(兀2』2亡2),欧儿里得距离的计算公式是:Euclid2)=Ju—兀2)2+(X—>‘2)2+(石一°)2本文应用的是

4、聚类分析法小的层次分析法,选用的是欧几里得距离的计算方法。层次分析法通过把距离接近的数据一步一步归为一类,直到数据数据完全归为一个类别为止,再利用一些相应的指标来确定聚为儿类的结果是最为介适的。显然,这一系列的聚类结果存在着嵌套,或者说是层次的关系,由于这种结果上的层次关系,整个分析过程,特别是每一步中完成的合并或分割都可以用一张二维空I'可的图形來表示,这种图被称为“树状图”,是层次聚类法结果解释的重要工具。本文也将利用这一工具对我国商业银行竞争力水平进行研究。2股份制商业银行竞争力的实证分析2.1样本数据的选取和处理一、

5、样本选取本文评价的是我国股份制商业银行的竞争力,以我国国有商业银行和城市商业银行的比较研究得出我国股份制商业银行竞争力的优势与劣势。由于数据选取的局限性(在本文写作过程中,各家商业银行还未全部公布2009年年报),本文数据主要來自于各商业银行的年报数据中】以及各家银行网站披餌相关信息,因此鉴于数据搜集原因,本文采用了2008年的股份制商业银行、国有商业银行和城市商业银行的的数据。同时由于无法获得屮国光大银行、广东发展银行、恒丰银行、浙商银行和渤海银行等五家银行的财务报表(这五家股份制商业银行不是上市商业银行,非上市银行披露的

6、数据一般不具有全面性和及时性,真实度也较差),所以本文最终研究的是7家股份制商业银行:屮信银行、华夏银行、深圳发展银行、招商银行、上海浦东发展银行、兴业银行、民生银行。同理,本文选取了4家国冇商业银行1作为比较研究对象:中国工商银行、中国银行、中国建设银行和交通银行。考虑到已上市城市商业银行也具有一定的竞争力,在某些方面冇借鉴Z处,FL代表了城市商业银行的新兴力量,因此将已上市的3家城市商业银行纳入股份制商业银行竞争力对比研究当中,作为比较研究对象,这3家已上市城市商业银行为:北京银行、上海银行、南京银行。二、指标的标准化在

7、指标处理前,先要对原始数据标准化,标准化后的变量为X*i,j,即第i个银行的j指标,具体的标准化如下:X*=X厂minXy对于正指标:"manX-minXi}对于逆指标:maxXu一Xu•FJmaxXi}-minX甘其中,正指标与银行竞争力得分呈正相关关系,相应的逆指标与竞争力得分成负相关关系。标准化消除了疋逆指标的影响,正指标原本越大,处理后也越大,逆指标情况则相反。2.2实证分析2.2.1因子分析运用SPSS软件对原始指标数据进行实证分析,可以得到相关系数矩阵及变量共同度表,见表2.1,分析可得所有变量的共同度都比较大。

8、变量共同度说明了全部公因子反映出原变量信息的百分比,描述了全部公因子对变量X的总方差所做的贡献。较大的变量共同度说明变量空间转化为因子空间时,保留了比较多的信息。所以进行因子分析是有依据的。表2.1变量共同度表Tab.2.1Commonvariabledegreetable变虽XIX2X3

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。