多元统计分析教学案

多元统计分析教学案

ID:27592166

大小:1022.50 KB

页数:22页

时间:2018-12-04

多元统计分析教学案_第1页
多元统计分析教学案_第2页
多元统计分析教学案_第3页
多元统计分析教学案_第4页
多元统计分析教学案_第5页
资源描述:

《多元统计分析教学案》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、专业资料分享第一章绪论1多元统计分析的概念多元统计分析就是利用统计学和数学方法,将隐没在大规模原始数据群体中的重要信息集中提炼出来,简明扼要的把握系统的本质特征,分析数据系统中的内在规律性。利用多元分析中不同的方法还可以对研究对象进行分类和简化。多元分析是实现做定量分析的有效工具。2多元分析的起源和发展1)1928年,Wishart发表《多元正态总体样本协差阵的精确分布》,是多元统计分析的开端;2)20世纪30年代多元分析在理论上得到迅速发展;3)20世纪40年代应用于心理、教育、生物等方面;但由于计算量太大,其发展受到影响;4)5

2、0年代中期,由于电子计算机的出现和发展,使多元分析方法得到广泛应用;5)60年代由于新理论、新方法不断涌现使多元分析方法的应用范围更加扩大;6)多元统计在我国发展较晚,70年代初在我国才受到各个领域的极大关注,应用日益广泛。3多元分析能解决的实际问题   多元分析在工业、农业、医学、经济学、教育学、体育科学、生态学、地质学、社会学、考古学、环境保护、军事科学、甚至文学中都有广泛应用,足见其应用的深度和广度。4多元分析课程讲授的主要内容本课程重点介绍多元分析中常用的六种方法:聚类分析;判别分析;主成分分析;因子分析;对应分析;典型相关

3、分析我们这门课重点在于应用,参考课本中的公式推导为次要内容,大致了解即可,对每一种分析方法我们要清楚掌握它解决哪类问题、前提条件和局限性,以及它们相互之间的区别与联系;会用SAS、SPSS等数学软件实现上述过程,对所研究的问题能做出合理推断和科学评价。5原始资料阵及其标准化1)原始资料阵:设有个样品,项指标(变量),组成矩阵,2)第项指标均值,3)指标的协方差阵,其中WORD格式编辑整理专业资料分享4)原始指标(变量)的标准化第二章 聚类分析1 什么是聚类分析1.1聚类分析的概念聚类分析又称群分析、点群分析,是定量研究样品或指标分类

4、问题的一种多元统计方法。其中类指相似元素的集合。1.2聚类分析的基本思想认为所研究的样品或指标之间存在着程度不同的相似性,根据一批样品的多个观测指标,找出能够度量样品或变量之间相似程度的统计量,并以此为依据,采用某种聚类法,将所有的样品或变量分别聚合到不同的类中,使同一类中的个体有较大的相似性,不同类中的个体差异较大。2距离与相似系数聚类分析的目的是将研究对象进行分类。它是在事先不知类别的情况下对数据进行分类的分析方法。分类的依据有两类:距离与相似系数。2.1变量的类型1)间隔尺度变量:连续量,如速度,重量等。2)间隔尺度变量:等级

5、,有次序关系,如一级品、二级品等。3)间隔尺度变量:无等级也无数量关系,如性别,产品型号。2.2常用的距离有以下几种:1)明考夫斯基距离:2)绝对距离:3)欧氏距离:4)切比雪夫距离:5)马氏距离:,其中,为协方差阵6)兰氏距离:2.3常用的相似系数有以下几种:WORD格式编辑整理专业资料分享1)夹角余弦:2)相关系数:聚类分析根据所用方法不同可分为系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法等等;根据分类对象不同又分为对样品聚类(又称Q型聚类分析)以及对变量进行聚类(又称R型聚类分析)。对前者聚类多用距离,而后者聚类时多用相

6、似系数。3系统聚类法3.1系统聚类法的基本思路就近原则:首先,将n个样品看成n类,定义各样品之间的距离(此时其亦为类间距离);其次,按照某种原则将最接近的两类合并为一个新类,于是得到n-1类,定义并计算各类间距离,然后再从中找出最接近的两类合并成一个新类,重复以上步骤,直到全部样品合并成一类为止,将上述合并过程画成聚类谱系图,据此图可将全部样品分类。3.2八种系统聚类方法正如样品之间的距离可以有不同的定义方法一样,类与类之间的距离也有各种定义。类与类之间用不同的方法定义距离,就产生了不同的系统聚类方法,系统聚类方法包括最短距离法﹑最

7、长距离法﹑类平均法﹑重心法﹑WARD法等八种不同的方法,但这些方法聚类的步骤是完全一样的。当采用欧氏距离时,八种并类方法可归结为统一的递推公式。设,,,1)最短距离法:;2)最长距离法:;3)类平均法:;4)WARD法(离差平方和):;3.3谱系图及利用谱系图进行分类WORD格式编辑整理专业资料分享根据谱系图确定分类个数的准则:Bemirmen于1972年提出了应根据研究的目的来确定适当的分类方法,并提出了一些根据谱系图来分析的准则。准则A:各类重心之间的距离必须很大;准则B:确定的类中,各类所包含的元素都不要太多;准则C:类的个数

8、必须符合实用目的;准则D:若采用几种不同的聚类方法处理,则在各自的聚类图中应发现相同的类。应该指出,关于类的个数如何确定的问题,至今还没有一个合适的标准,也就是说对任何观测数据都没有唯一正确的分类方法。3.4分类个数的确定(统计量法)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。