第3章聚类分析

第3章聚类分析

ID:35480071

大小:80.34 KB

页数:7页

时间:2019-03-25

第3章聚类分析_第1页
第3章聚类分析_第2页
第3章聚类分析_第3页
第3章聚类分析_第4页
第3章聚类分析_第5页
资源描述:

《第3章聚类分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第三章聚类分析一、填空题1・在进行聚类分析时,根据变量取值的不同,变量特性的测量尺度有以下三种类型:、和O2.Q型聚类法是按进行聚类,R型聚类法是按进行聚类。3.Q型聚类统计量是,而R型聚类统计量通常采用o4.在聚类分析中,为了使不同量纲、不同取值范围的数据能够放在一起进行比较,通常需要对原始数据进行变换处理。常用的变换方法有以下几种:5•距离叭一般应满足以下四个条件:6•相似系数_般应满足的条件为:、和7•常用的相似系数有和两种。8.常用的系统聚类方法主要有以下八种:、9•快速聚类在SPSS屮由过程实现。--il/<710•常用的明氏距离公式为:d"•⑷=£

2、

3、心-心『,当9=1时,它表示;当q=2时,它表示;当g趋于无穷时,它表zjio11.聚类分析是将一批或,按照它们在性质上的进行分类。12•明氏距离的缺点主要表现在两个方面:第一,第二。13.马氏距离又称为广义的。14,设总体G为卩维总体,均值向量为“=(如血…,协差阵为工,贝IJ样品X=(X】,X2,…,XJ与总体G的马氏距离定义为o15•使用离茅平方和法聚类时,计算样品间的距离必须釆用。16.在SPSS中,系统默认定系统聚类方法是。17.在系统聚类方法小,和不具有单调性。18.离茅平方和法的基木思想來源于。19.最优分割法的基本步骤主要有三个:第一,;第第

4、二,20.最优分割法的基本思想是基于二、判断题1•在对数据行进小心化变换Z后,数据的均值为0,而协差阵不变,且变换后后的数据与变量的量纲无关。()2.根据分类的原理,我们可以把聚类分为样品聚类和变量聚类。()3.兰氏距离不仅克服了明氏距离与各指标的量纲有关的缺点,而且也考虑了变量间的相关性。()4•当各变量Z间相互独立时,马氏距离就退化为欧氏距离。()2.在几种系统聚类法屮,最短(长)距离法、(可边)类平均法、重心法和离差平方和法都貝有单调性,只有中间距离法不具有单调性。()3.重心法比离差平方和法使空间扩张。()4.离差平方和法的思想来源于方羌分析.如果类分

5、得比较合理,同类样品Z间的离差平方和应当较大,类与类之间的离差平方和应当较小.()&使用离弟平方和法时,计算样品间的距离必须采用欧氏距离.()8.快速聚类法又称为动态聚类法,是一种非谱系聚类法,它可以应用于比系统聚类法大得多的数据组.()9.明氏距离的优点在于考虑了各个指标Z间的相关性,而缺点在于它的值与齐指标的量纲有关。()11•马氏距离考虑了便了Z间观测变量Z间的相关性。()11.兰氏距离对大的奇异值不皱感,适合高度偏倚的数据,但是它没有克服与各指标的量纲有关的缺点。()三、简答题1.简述聚类分析的基本思想和基本步骤?2.系统聚类法的基本思想是什么?3.系

6、统聚类法的基本步骤是什么?4.简述最长聚类法的聚类步骤。5.简述快速聚类的基本思想及主要步骤。1.简述最优分割法的步骤2.简述Ward离差平方和法的基本思想.&在数据处理时,为什么通常要进行标准化处理?9.简述最优分割法的基本思想和基本步骤。四、计算题<0W109、1.假设有一个二维正态总体,它的分布为:“2n,nn,并且还已知I0JI0.91有两点A=(1,1)和B=(1,-1),要求分别用马氏距离和欧氏距离计算这两点A和B各自到总体均值点“=(0,()j的距离.2.设有5个样品,已知各样品Z间的距离矩阵为:GJ0G25G.3.501.542.50GJ723

7、.560试分别用最短距离法和最长距离法聚类。3.为研究全国31个省区城镇屈民生活消费的分布规律,根据2003年统计资料利用SPSS软件屮的系统聚类法做类型划分,其谱系图如下,你认为从全国各省区的消费情况看,分为儿类较合适,结合我国区域社会及经济发展情况,对分类结果作简要分析。******HIERARCHICALclusterANALYSIS******DendrogramusingAverageLinkage(BetweenGroups)RescaledDistanceClusterCombine10152025LabelNum+青海29-1宁夏30一河南16

8、—甘肃28—河北3—四川23一陕西27一湖北17一湖南18」内蒙占5一新卿31一吉林7_黑龙江8—CASE05山西4辽宁6云南25安徽12贵州24江西14江苏10重庆22山东15福建13广西20海南21天津2四藏26浙江11广东19上海9北京14.下面给出了八个样品的两个指标数据12315678Xi小24013523x24713129111416试用中间距离法进行聚类,样品间的距离采用欧氏距离。五、SPSS操作题1.某校从高中二年级女生中随机抽取16名,测得身高和体重数据如下表:序号身高(cm)体重(kg)序号身高(cm)体重(kg)116049916045

9、2159461016044316041

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。