实验十二聚类分析

实验十二聚类分析

ID:41671905

大小:73.32 KB

页数:6页

时间:2019-08-29

实验十二聚类分析_第1页
实验十二聚类分析_第2页
实验十二聚类分析_第3页
实验十二聚类分析_第4页
实验十二聚类分析_第5页
资源描述:

《实验十二聚类分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实验十二聚类分析■聚类分析是研究“物以类聚”问题的多元统计分析方法。■聚类分析是一种建立分类的多元统计分析方法,它能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度在没冇先验知识的情况下进行自动分类,产生多个分类结杲。■类内部的个体在特征上具有相似性,不同类间个体特征的差异性较大。基本思想:■分层次聚类和K-均值聚类;■层次聚类又称系统聚类,是指其聚类过程是按照一定层次进行的;■层次聚类冇两种类型,Q型聚类和R型聚类。■Q型聚类是对样木(case)进行聚类,R型聚类是对变量(variable)进行聚类

2、。■K-均值聚类又称快速聚类,需事先指定聚类数目K和K个初始类屮心,是一个反复迭代的分类过程,在聚类过程中,样木所属的类会不断调整,直到最终达到稳定为止。注意事项:■所选择的变量应符合聚类要求。■各变量的变量值不应有数量级上的差异。■各变量间不应有较强的线性相关关系。层次聚类分析步■选择:分析Analyze==>分类Classify=>层次聚类HierarchicalCluster;1>选择分析Analyze==>分类Classify==>层次聚类HierarchicaICluster;2、把参与层次聚类分析的变量选

3、择到变量Variable(s)框中;3、把一个字符型变量作为标记变量选到标签Lablecasesby框中,它将大大增强聚类分析结果的可读性;4、在聚类Cluster框中选择聚类类型,其中样本Cases表示Q型聚类(默认类型),变量Variables表示R型聚类;5、在Display框中选择输出内容。其中统计Statistics表示输出聚类分析的相关统计量,图形Plots表示输出聚类分析的相关图形。6、单击方法Method按钮指定距离的计算方法,其中聚类方法ClusterMethod框中给出的是计算个体与小类、小类与小

4、类间距离的方法;测量Measure框中给出的是不同变量类型下的个体距离的计算方式。其中■Interval框中的方法适用于连续型定距变量;■Counts框屮的方法适用于计数型变量;■Binary框中的方法适用于二值变量;7、如果参与聚类分析的变量存在数量级上的差异,应在数值变换TransformValues框中的标准化Standardize选项中选择消除数量级差的方法,并指定处理是针对变量还是针对样本。Byvariable表示针对变量,适于Q型聚类分析;Bycases表示针对样本,适于R型聚类分析。消除数量量纲的方法包

5、括:■None:表示不进行任何处理;■Zscores:表示计算Z分数。它将各变量值减去均值后除以标准差。标准化后的变量值平均值为0,标准差为1;■Range-1to1:表示将各变量值除以全距,处理以后的变量值的范围在-1~1Z间,该方法适于变量值中有负值的变量;■Range0to1:表示将各变量值减去最小值后除以全距,处理以后的变量值的范围在0〜1之间;■Maximummagnitudeof1:表示将各变量值除以最大值。处理以后的变量值的最大值为1;■Meanof1:表示将各变量值除以均值。■Standarddevi

6、ationof1:表示将各变量值除以标准差。8、单击Statistics按钮指定输出哪些统计量。Agglomerationschedule表示输出聚类分析的凝聚状态表;Proximitymatrix表示输出个体间的距离矩阵;ClusterMembership框中,None表示不输出样本所属类,SingleSolution表示指定输出当分成n类时各样本所属类,是单一解。Rangeofsolution表示指定输出当分成M至n类时各样本所屈类,是多个解。9、单击Plots按钮指定输出哪种聚类分析图。Dendrogram选项

7、表示输出聚类分析树形图;在Icicle中指定输出冰挂图,Allclusters表示输出聚类分析每个阶段的冰挂图;Specifiedrangeofclusters表示只输出某个阶段的冰挂图,输入从第几步开始,到第几步结束,中间间隔几步;在Orientation框中指定如何显示冰挂图,其屮垂直Vertical表示纵向显示,水平Horizontal表示横向水平显示。10、单击Save按钮可以将聚类分析结果以变量的形式保存到数据编辑窗口中。生成的变量名为clun-m(如clu2-l),其屮n表示类数(如2),m表示第m次分析

8、(如1)。由于不同的距离计算方法会产生不同的聚类分析结果,即使聚成n类,同一样本的类归屈也会因计算方法的不同而不同,因此实际分析屮应反复尝试以最终得到符合实际的合理解,并保存于SPSS变量中。K均值聚类分析步羽选择:分析AnaIyze==>分类CICluster;步骤1、选择分析Analyze二二〉分类Class辻y=>K均值聚类K~Means

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。