SPSS聚类分析加具体案例.pdf

SPSS聚类分析加具体案例.pdf

ID:23537382

大小:535.53 KB

页数:7页

时间:2018-11-08

SPSS聚类分析加具体案例.pdf_第1页
SPSS聚类分析加具体案例.pdf_第2页
SPSS聚类分析加具体案例.pdf_第3页
SPSS聚类分析加具体案例.pdf_第4页
SPSS聚类分析加具体案例.pdf_第5页
资源描述:

《SPSS聚类分析加具体案例.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、六、聚类分析(一)概述1.聚类分析的目的根据已知数据,计算样本或者变量之间亲疏关系的统计量(距离或相关系数)。根据某种准则(最短距离法、最长距离法、中间距离法、重心法),使同一类内的差别较小,而类与类之间的差别较大,最初达到的就是将样本或变量分成若干类。2.聚类分析的分类划分标准名称概述优缺点分类的对象Q-型聚类对样本进行分类R-型聚类对变量进行分类分类的原理系统聚类将一定数量的样本或指标看优点:限制少,不需要成一类,根据亲疏程度,将预先给出聚类数目;可亲疏程度最高的合并,然后发现层次关系考虑合并后的类与其它类的缺点:复杂度高,异常亲疏程度,再合并,不断重值也会产生影响;复

2、这个过程,直到将所有样本合成一类。快速聚类要求给出需要聚成多少类,优点:快速高效;复杂再让样本凝聚,形成初始分度低类,然后再按照最近距离原则修改不合理的分类,直到缺点:需要积累一定的合理为止实践经验(给出聚类的数目);较大的异常值会产生很大影响(对异常值敏感)3.距离与相似性为了对样本或者变量进行分类,就需要研究样本之间的关系,最常用的方法有两个。方法分类分类概述相似系数(性质越接近的夹角余弦等于1说明两个样本完样本,相似系数的绝对值全相似;接近1说明相似越接近于1,而无关的样密切;等于0说明完全不本相似系数的绝对值越一样;接近0说明差别大接近0)相关系数变量间的相关系数距

3、离(将样本看作空间的明氏距离一个点,并在空间定义距马氏距离排除了变量间相关性的离,距离近的归为一类,干扰距离远的归为不同类)兰氏距离使用于一切情况,但没有考虑变量之间的相关性(二)系统聚类1.系统聚类的步骤距离的具体定义及计算方式计算n各样本两两之间的距离将距离接近的数据依次合并为一类,再计算,再合并画聚类图,解释类与类之间的关系2.亲疏程度度量方法名称描述最短距离法个体与小类中每个个体距离的最小值最长距离法个体与小类中每个个体距离的最大值中间距离法两类样本的中位数之间的距离类平均法个体与小类中每个个体距离的平均值可变类平均法重心法个体与小类的中心点的距离Ward离

4、差平方和法聚类过程中使小类内离差平方和增加最小的两小类应该首先合并3.系统聚类的分类标准名称概述分类的对象Q-型聚类对样本进行分类R-型聚类对变量进行分类聚类的过程分解法开始把所有个体或者变量都归属为一类,然后根据距离和相似性逐层分解,直到参与聚类的每个个体自成一类为止凝聚法开始把所有参与聚类的个体或者变量都归属为一类,然后根据距离和相似性逐步合并,直到合并为一个大类为止4.SPSS操作及实例SPSS采用的是凝聚法。案例:根据30个省的23个主要行业的平均工资情况,通过聚类分析来判断哪些地区平均工资水平高。SPSS操作及结果:打开SPSS上方菜单栏中的分析->分类->系统

5、聚类选择变量->勾选统计量->在绘制里选择树状图和冰柱图勾选方法(通常使用组间联接)->度量区间->选择标准化方式(全距从0到1)下图为近似矩阵表,标注了相关系数,数值越大,距离越接近下图为聚类分析结果表,第一类表示这是聚类分析的第几步,第二三列表示该步中那几个样本或者小类聚成一类,第四列表示距离,第五六列表示本步骤中参与的是个体还是小类(0表示样本,非0表示第n步生成的小类),第七列表示本步骤的聚类结果将在以下第几步中用到。下面是冰柱图和树状图的结果,根据树状图可以看出,如果分为三类的话,第一类包括北京上海,第二类包括天津、广东、浙江、江苏、西藏,剩下的归为一类

6、。(三)快速聚类(适合大样本聚类)1.快速聚类的步骤指定聚类数目K确定K个初始类的中心(自定义或者根据数据中心初步确定)根据距离最近的原则进行分类根据新的中心位置,重新计算每一记录距离新的类别中心的的距离,并重新分类重复步骤4,直到达到标准2.SPSS操作及实例打开SPSS上方菜单栏中的分析->分类->K-均值聚类选择变量->勾选统计量->定义变量值选择迭代次数->选项(勾选初始聚类中心、每个个案的聚类信息)->定义变量值->保存(勾选聚类成员、聚类中心距离)下图为输出的初始聚类中心下图为最终距离中心,第一类平均工资最高,第二类次之,第三类最低下图为每

7、个聚类中的案例数和聚类成员

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。