数学建聚类分析因子分析实例

数学建聚类分析因子分析实例

ID:44049553

大小:712.66 KB

页数:24页

时间:2019-10-18

数学建聚类分析因子分析实例_第1页
数学建聚类分析因子分析实例_第2页
数学建聚类分析因子分析实例_第3页
数学建聚类分析因子分析实例_第4页
数学建聚类分析因子分析实例_第5页
资源描述:

《数学建聚类分析因子分析实例》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、多元统计分析中的降维方法在四川省社会福利中的应用曲于计算机的发展和F1益广泛的使用,多元分析方法也很快地应用到社会学、农业、医学、经济学、地质、气象等各个领域。在国外,从口然科学到社会科淫的许多方而,都己证实了多元分析方法是一种很冇用的数据处理方法;在我国,多元分析对于农业、气象、国家标准和误差分析等许多方面的研究工作都取得了很大的成绩,引起了广泛的注意。在许多领域的研究屮,为了全面系统地分析问题,对研究对象进行综合评价,我们常常需要考虑衡量问题的多个指标(即变量),由于变量Z间可能存在着相关性,如果采用一元统计方法,把多个变量分开,一次

2、分析一个变量,就会丢失大量的信息,研究结果也会偏差很大。因此需要采用多元统计分析的方法,同时对所有变量的观测数据进行分析。多元统计分析就是一种同吋研究多个变量之间的相互关系,经过对变量的综合处理,充分提取变量之间的信息,进行综合分析和评价的统计方法。多元统计分析法主要包括降维、分类、回归及其他统计思想。多元统计分析方法中降维的方法1.概述多元统计分析方法是同时对多个变量的观察数据做综合处理和分析。在不损失有价值信息的情况卜,简化观测数据或数据结构,尽可能简单地将被研究对象描述出来,使得对复杂现彖的解释变得更容易些。同时,采用多元统计分析屮

3、的聚类分析或判别分析可以对变量或样品进行分类与分组。根据所测量的特征和分类规则将一些“类似的”对象或变量分组。多元统计分析也可以研究变量间依赖性。即对变量间关系的本质进行研究。是否所冇的变量都相互独立?还是一个变量或多个变量依赖于其他变量?它们又是怎样依赖的?通过观测变量数据的散点图,我们可以建立多元回归统计模型,确定岀变量Z间具体的依赖关系,进而可以根据某些变量的观测值预测另一个或另一些变量的值对事物现象的发展作预测。最后我们需要构造假设,并对所建立的以多元总体参数形式陈述的多种特殊统计假设进行检验。在多元统计分析方法中数据简化或结构简

4、化,实质上就是数学中的降维方法。多元统计分析屮的降维方法主耍包括聚类分析、判别分析、主成分分析、因子分析、对应分析和典型相关分析等儿种方法。其中主成分分析和因子分析是在作综合评价方面应用最广泛、较为有效的方法。木文主要介绍这两种多元统计分析方法的应用。2主成分分析2.1主成分分析的基本思想在大部分实际问题屮,需要考察的变量多,变量之间是有一定的相关性的,主成分分析就是以损失很少部分信息为代价,保留绝大部分信息的前提下,将原来众多具冇一定线性相关性的p个指标压缩成少数几个互不相关的综合指标(主成分),并通过原来变量的少数儿个的线性组合来给出

5、各个主成分的具有实际背景和意义的解释。由于主成分分析浓缩了众多指标的信息,降低了指标的维度,从而简化指标的结构,深刻反映问题的内在规律。2.2主成分分析的数学模型设对某一事物的研究涉及指标(变量):X],X2,…,Xp,,这〃项指标构成p维的随机向量X=(X

6、,X2,・「xJ,其均值和协方差矩阵分别是“=E(x),Zo对X进行线性变换,原来的变量X

7、,X2,…,Xp的线性组合可以形成新的综合变量,用Y表示,满足:X=M

8、X[+«12X2+Yo=c+•••+XJJ一一J—・矩阵表示为:Y=UX,其中由丁•不同的线性变换得到的综合变量Y的统计

9、特性不同,为了达到较好的效果,我们希槊的方差尽可能大且新的综合变量X之间相互独立。由以下原则來确定新的综合变量乙:(])U-II-—Uj]++…・+Ujp=1(d=1,2,•…,p);(2)乙与};•相互独立,即无重复信息cov(W必)=0(&j;i,j=,2,・・・,p);(3)乙是X】,X2,・・・,Xp的一切线性组合(系数满足上述方程组)中方差最大的,Y2是与K不和关的XpX2,---,XP的一切线性组合中方井最大的,纬与X,笃,…,乙―都不相关的xpx2,...,Xp的一切线性组合中方差最大的。在实际应用时,通常挑选丽几个方差比

10、较大的主成分,虽然这样做会丢失一部分信息,但它使我们抓住了主要矛盾进行深入分析,并从原始数据屮进一步捉岀了某些新的信息,因而在某些实际问题的研究中得益比较大,这种既减少了变量的个数又抓住了主要矛盾的做法有利于问题的分析和处理。2.3总体主成分的导出及性质在实际求解主成分时,常常是从原始变量的协方羞矩阵或相关矩阵的结构出发,而从两个出发点求解出的主成分不同。2.3.1从协方差矩阵岀发求解主成分性质1:设矩阵A'=A,将A的特征值人仏,…,人依大小顺序排列,不妨设人…血,y仏…,人为矩阵人各特征值对应的标准正交特征向量,则对任意向量兀有ma

11、x-=Z,min-=A如()兀'兀“0性质2:设随机向量X=住川2,…,XJ的协方差矩阵为工,人…沙“为工的特征值,",•••,人为矩阵丫各特征值对应的标准止交向量,则第,个主成分为:丫严祸+

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。