多元统计分析简介

多元统计分析简介

ID:25204798

大小:1.37 MB

页数:64页

时间:2018-11-16

多元统计分析简介_第1页
多元统计分析简介_第2页
多元统计分析简介_第3页
多元统计分析简介_第4页
多元统计分析简介_第5页
资源描述:

《多元统计分析简介》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多元统计分析简介1.聚类分析2.判别分析3.主成分分析4.典型相关分析聚类分析又称群分析,它是研究分类问题的一种多元统计方法。所谓类,通俗地说,就是指相似元素的集合。那么要将相似元素聚为一类,通常选取元素的许多共同指标,然后通过分析元素的指标值来分辨元素间的差距,从而达到分类的目的。聚类分析可以分为:Q型(样品分类)分类、R型(指标分类)分类。这里介绍的是Q型(样品分类)分类。1.聚类分析聚类分析前的预处理步骤:1)确定聚类类型:对样品聚类称Q型聚类;对变量聚类称R型聚类。2)数据预处理原因:实际应用所使

2、用的样本资料中,由于不同的变量具有不同的计量单位(或量纲),并且具有不同的数量级,为了使具有不同计量单位和数量级的数据能够放在一起进行比较分析,通常都要对数据进行变换处理。常用方法有:中心化变换;规格化变换(极差正规化);标准化变换;对数变换等1.聚类分析3)研究样品之间的关系。通常有两种方法:相似系数。性质相近的相似系数的绝对值越接近于1,彼此不相关的相似系数的绝对值越接近于0。常用相似系数有:夹角余弦;相关系数;指数相似系数;非参数方法灯计算距离。将样品看作P维空间的一点,通过计算不同样品的距离,距离

3、越接近的点归为一类,距离远的点归为不同类。常用距离有:明科夫斯基距离;欧氏距离;绝对值距离;切比雪夫距离;兰氏距离;马氏距离。4)计算距离矩阵或相似性系数矩阵D。1.聚类分析聚类分析的一般步骤(Q-型分类)2)由距离矩阵或相似性系数矩阵D,找到当前最小的Dij,并将类Gi、Gj合为一类得到一个新类Gr={Gi、Gj}3)从新计算类间的距离,得到新的矩阵D。4)重复第2步直到全部合为一类。1)每个样本独自成类,1.聚类分析进行聚类分析时,由于对类与类之间的距离的定义和理解不同,并类的过程中又会产生不同的聚类

4、方法。常用的系统聚类方法有8种:最短距离法;最长距离法;中间距离法;重心法;类平均法;可变类平均法;可变法;离差平方和法。1.聚类分析判别分析方法最初应用于考古学,例如要根据挖掘出来的人头盖骨的各种指标来判别其性别年龄等.近年来,在生物学分类,医疗诊断,地质找矿,石油钻探,天气预报等许多领域,判别分析方法已经成为一种有效的统计推断方法。判别分析是一种在一些已知研究对象用某种方法已经分成若干类的情况下,确定新的样品的观测数据属于哪一类的统计分析方法。2判别分析常用的方法有:距离判别法、Fisher判别法、贝

5、叶斯判别法、逐步判别法。为了能识别待判断的对象x=(x1,x2,…,xm)T是属于已知类A1,A2,…,Ar中的哪一类?事先必须要有一个一般规则,一旦知道了x的值,便能根据这个规则立即作出判断,称这样的一个规则为判别规则(用于衡量待判对象与各已知类别接近程度的方法准则)。判别规则往往通过的某个函数来表达,我们把它称为判别函数,记作W(i;x).2判别分析Bayes判别法的基本思想:总是假设对所研究的对象已有一定的认识,计算新给样品属于各总体的条件概率比较这个概率的大小,然后将新样品判归为来自概率最大的总体

6、。Bayes判别法2判别分析设有总体,具有概率密度函数。并且根据以往的统计分析,知道出现的概率为。即当样本发生时,求他属于某类的概率。由贝叶斯公式计算后验概率,有:判别规则则判给。2判别分析Bayes判别法的一般步骤:及均值向量,各变量的总均值及均值向量;1.计算各类中变量的均值2.计算类内协方差矩阵S及其逆矩阵S-1;3.计算Bayes判别函数中,各个变量的系数及常数项并写出判别函数;4.计算类内协方差矩阵W及总各协方差矩阵T作多个变量的全体判别效果的检验;5.各个变量的判别能力的检验;6.判别新样本应

7、属于的类别。2判别分析在判别问题中,当判别变量个数较多时,如果不加选择地一概采用来建立判别函数,不仅计算量大,还由于变量之间的相关性,可能使求解逆矩阵的计算精度下降,建立的判别函数不稳定。因此适当地筛选变量的问题就成为一个很重要的事情。凡具有筛选变量能力的判别分析方法就统称为逐步判别法。逐步判别法2判别分析逐步判别法其基本思路类似于逐步回归分析,按照变量是否重要逐步引入变量,每引入一个“最重要”的变量进入判别式,同时要考虑较早引入的变量是否由于其后的新变量的引入使之丧失了重要性变得不再显著了(例如其作用被

8、后引入地某几个变量的组合所代替),应及时从判别式中把它剔除,直到判别式中没有不重要的变量需要剔除,剩下来的变量也没有重要的变量可引入判别式时,逐步筛选结束。也就是说每步引入或剔除变量,都作相应的统计检验,使最后的判别函数仅保留“重要”的变量。2判别分析1.计算各总体中各变量的均值和总均值以及似然统计量,规定引入变量和剔除变量的临界值F进、F出。2.逐步计算,计算全部变量的判别能力,在已入选变量中考虑剔除可能存在的最不显著变量。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。