《SPSS的聚类分析》PPT课件.ppt

《SPSS的聚类分析》PPT课件.ppt

ID:51992412

大小:456.50 KB

页数:28页

时间:2020-03-27

《SPSS的聚类分析》PPT课件.ppt_第1页
《SPSS的聚类分析》PPT课件.ppt_第2页
《SPSS的聚类分析》PPT课件.ppt_第3页
《SPSS的聚类分析》PPT课件.ppt_第4页
《SPSS的聚类分析》PPT课件.ppt_第5页
资源描述:

《《SPSS的聚类分析》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第九章SPSS的聚类分析10/6/202119.1聚类分析的一般问题9.1.1聚类分析的意义聚类分析是统计学中研究“物以类聚”问题的多元统计分析方法。聚类分析是一种建立分类的多元统计分析方法,它能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类,产生多个分类结果。类内部的个体在特征上具有相似性,不同类间个体特征的差异性较大。10/6/20212例如,学校里有些同学经常在一起,关系比较密切,而他们与另一些同学却很少来往,关系比较疏远。究其原因可能会发现,经常在一起的同学的家庭情况、性格、学习成绩、课余爱好等方面有许多共同之处,而关系比较疏远

2、的同学在这些方面有较大的差异性。为了研究家庭情况、性格、学习成绩、课余爱好等是否会成为划分学生小群体的主要决定因素,可以从有关这些方面的数据入手,进行客观分组,然后比较所得的分组是否与实际相吻合。对学生的客观分组就可采用聚类分析方法。10/6/202139.1.2聚类分析中“亲疏程度”的度量方法1、定距型变量个体间距离的计算方式欧式距离(Euclideandistance)平方欧式距离(SquaredEuclideandistance)切比雪夫(Chebychev)距离Block距离明考斯基(Minkowski)距离夹角余弦(Cosine)距离用户自定义(Customized)距离10/

3、6/202142、计数变量个体间距离的计算方式卡方(Chi-Squaremeasure)距离Phi方(Phi-Squaremeasure)距离3、二值(Binary)变量个体间距离的计算方式简单匹配系数(SimpleMatching)雅科比系数(Jaccard)注:聚类分析的几点说明所选择的变量应符合聚类的要求各变量的变量值不应有数量级上的差异各变量间不应有较强的线性相关关系10/6/202159.2层次聚类9.2.1层次聚类的两种类型和两种方式层次聚类又称系统聚类,简单地讲是指聚类过程是按照一定层次进行的。层次聚类有两种类型,分别是Q型聚类和R型聚类;层次聚类的聚类方式又有两种,分别是

4、凝聚方式聚类和分解方式聚类。10/6/20216Q型聚类:对样本进行聚类,使具有相似特征的样本聚集在一起,使差异性大的样本分离开来。R型聚类:对变量进行聚类,使具有相似性的变量聚集在一起,差异性大的变量分离开来,可在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数,达到变量降维的目的。10/6/20217凝聚方式聚类:其过程是,首先,每个个体自成一类;然后,按照某种方法度量所有个体间的亲疏程度,并将其中最“亲密”的个体聚成一小类,形成n-1个类;接下来,再次度量剩余个体和小类间的亲疏程度,并将当前最亲密的个体或小类再聚到一类;重复上述过程,直到所有个体聚成一个大类为止。可

5、见,这种聚类方式对n个个体通过n-1步可凝聚成一大类。分解方式聚类:其过程是,首先,所有个体都属一大类;然后,按照某种方法度量所有个体间的亲疏程度,将大类中彼此间最“疏远”的个体分离出去,形成两类;接下来,再次度量类中剩余个体间的亲疏程度,并将最疏远的个体再分离出去;重复上述过程,不断进行类分解,直到所有个体自成一类为止。可见,这种聚类方式对包含n个个体的大类通过n-1步可分解成n个个体。SPSS中的层次聚类采用的是凝聚方式。10/6/202189.2.2个体与小类、小类与小类间“亲疏程度”的度量方法SPSS中提供了多种度量个体与小类、小类与小类间“亲疏程度”的方法。与个体间“亲疏程度”

6、的测度方法类似,应首先定义个体与小类、小类与小类的距离。距离小的关系亲密,距离大的关系疏远。这里的距离是在个体间距离的基础上定义的,常见的距离有:10/6/20219最近邻居(NearestNeighbor)距离:个体与小类中每个个体距离的最小值。最远邻居(FurthestNeighbor)距离:个体与小类中每个个体距离的最大值。组间平均链锁(Between-groupslinkage)距离:个体与小类中每个个体距离的平均值。组内平均链锁(Within-groupslinkage)距离:个体与小类中每个个体距离以及小类内各个体间距离的平均值。重心(Centroidclustering)距

7、离:个体与小类的重心点的距离。离差平方和法(Ward’smethod):聚类过程中使小类内离差平方和增加最小的两小类应首先合并为一类。10/6/2021109.2.3层次聚类的基本操作1、选择菜单Analyze-Classify-HierarchicalCluster,出现窗口:10/6/2021112、把参与层次聚类分析的变量选到Variable(s)框中。3、把一个字符型变量作为标记变量选到LabelCasesby框中,它将大大

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。