SPSS的聚类分析.ppt

SPSS的聚类分析.ppt

ID:49410957

大小:229.50 KB

页数:40页

时间:2020-02-06

SPSS的聚类分析.ppt_第1页
SPSS的聚类分析.ppt_第2页
SPSS的聚类分析.ppt_第3页
SPSS的聚类分析.ppt_第4页
SPSS的聚类分析.ppt_第5页
资源描述:

《SPSS的聚类分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第八章SPSS的聚类分析聚类分析概述(一)概念(1)聚类分析是统计学中研究“物以类聚”的一种方法,属多元统计分析方法.例如:细分市场、消费行为划分聚类分析是建立一种分类,是将一批样本(或变量)按照在性质上的“亲疏”程度,在没有先验知识的情况下自动进行分类的方法.其中:类内个体具有较高的相似性,类间的差异性较大.聚类分析概述两类:(001002)(003004005)三类:(001002)(003)(004005)(2)例如聚类分析概述(3)总结上述分类的原则:依据学生成绩的差距,差距较小的为一类分类过程

2、中,没有事先指定分类的标准.完全根据样本数据客观产生分类结果.(4)SPSS中的聚类方法分层聚类K-MEANS快速聚类聚类分析概述(二)特点聚类分析前所有个体所属的类别是未知的,类别个数一般也是未知的,分析的依据只有原始数据,可能事先没有任何有关类别的信息可参考严格地,聚类分析并不是纯粹的统计技术,不象其他多元分析,需要从样本去推断总体一般不涉及统计量分布,也不需显著性检验聚类分析更象是一种建立假设的方法,而对相关假设的检验还需要借助其他统计方法聚类分析概述(三)注意聚类分析主要用于探索性研究,其分析结

3、果可提供多个可能的解,最终解的选择需要研究者的主观判断和后续分析聚类分析的解完全依赖于研究者所选择的聚类变量,增加或删除一些变量对最终解都可能产生实质性的影响不管实际数据中是否存在不同的类别,利用聚类分析都能得到分成若干类别的解分层聚类(一)思路:聚类过程具有一定的层次性以合并(凝聚)的方式聚类(SPSS采用)首先,每个个体自成一类其次,将最“亲密”的个体聚成一小类然后,将最“亲密”的小类或个体再聚成一类重复上述过程,即:把所有的个体和小类聚集成越来越大的类,直到所有的个体都到一起(一大类)为止可见,随

4、着聚类的进行,类内的“亲密”性在逐渐减低——一旦个案(变量)被聚为一类,以后分类结果不会改变分层聚类(一)思路以分解的方式聚类首先,所有个体都属于一类其次,将大类中最“疏远”的小类或个体分离出去然后,分别将小类中最“疏远”的小类或个体再分离出去重复上述过程,即:把类分解成越来越小的小类,直到所有的个体自成一类为止可见,随着聚类的进行,类内的亲密性在逐渐增强分层聚类(二)“亲疏”程度的衡量(1)衡量指标相似性:数据间相似程度的度量距离:数据间差异程度的度量.距离越近,越“亲密”,聚成一类;距离越远,越“疏

5、远”,分别属于不同的类(2)衡量对象个体间距离个体和小类间、小类和小类间的距离分层聚类(三)定距型个体间的距离把每个个案数据看成是k维空间上的点,在点和点之间定义某种距离.一般适用于定距数据欧氏距离(EUCLID)平方欧氏距离(SEUCLID)马氏距离(BLOCK)切比雪夫距离(CHEBYCHEV)明考斯基绝对值幂距离(POWER)分层聚类结论:由于3.61距离最小,因此(004,005)首先聚成一类个体距离矩阵(三)定距型个体间的距离欧氏距离举例分层聚类(四)品质型个体间的距离简单匹配(simplem

6、atching)系数:适用二值变量。样本j样本i101ab0cda为样本i与样本j在所有变量上同时取1的个数;d为同时取0的个数特点:排除同时拥有或同时不拥有某特征的情况;取0和1地位等价,编码方案的变化不会引起系数的变化。分层聚类(四)品质型个体间的距离简单匹配(simplematching)系数:适用二值变量姓名授课方式上机时间选某门课程张三111李四110王五001(张三,李四):a=2b=1c=0d=0d(x,y)=1/(1+2)=1/3(张三,王五):a=1b=2c=0d=0d(x,y)=2/

7、(1+2)=2/3张三距李四近分层聚类(四)品质型个体间的距离雅科比(Jaccard)系数:适用二值变量样本j样本i101ab0cda为样本i与样本j在所有变量上同时取1的个数;d为同时取0的个数特点:排除同时不拥有某特征的情况;取1的状态比取0更有意义(如:临床检验中的阳性特征);编码方案会引起系数的变化分层聚类(四)品质型个体间的距离雅科比(Jaccard)系数:适用二值变量姓名授课方式上机时间选某门课程张三1(0)1(0)1(0)李四1(0)1(0)0(1)王五0(1)0(1)1(0)(张三,李四

8、)1:a=2b=1c=0d=0d(x,y)=1/(1+2)=1/3(张三,李四)2:a=0b=0c=1d=2d(x,y)=1/(1+2)=1/3(相同)(张三,李四)1:a=2b=1c=0d=0J(x,y)=1/(1+2)=1/3(Jaccard)(张三,李四)2:a=0b=0c=1d=2J(x,y)=1/1=1(不相同)(Jaccard)分层聚类(四)品质型个体间的距离Jaccard系数举例:根据临床表现研究病人是否有类似的病姓名性别发烧

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。