SPSS判别分析与聚类分析

SPSS判别分析与聚类分析

ID:36504629

大小:3.10 MB

页数:71页

时间:2019-05-09

SPSS判别分析与聚类分析_第1页
SPSS判别分析与聚类分析_第2页
SPSS判别分析与聚类分析_第3页
SPSS判别分析与聚类分析_第4页
SPSS判别分析与聚类分析_第5页
资源描述:

《SPSS判别分析与聚类分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、判别分析与聚类分析判别分析判别有一些昆虫的性别很难看出,只有通过解剖才能够判别;但是雄性和雌性昆虫在若干体表度量上有些综合的差异。于是统计学家就根据已知雌雄的昆虫体表度量(这些用作度量的变量亦称为预测变量)得到一个标准,并且利用这个标准来判别其他未知性别的昆虫。这样的判别虽然不能保证百分之百准确,但至少大部分判别都是对的,而且用不着杀死昆虫来进行判别了。判别分析(discriminantanalysis)判别分析和聚类分析有什么不同呢?主要不同点就是,在聚类分析中一般人们事先并不知道或一定要明确应该分成几类,完全根据数据来确定。而

2、在判别分析中,至少有一个已经明确知道类别的“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别了。例1:1991年全国各省、区、市镇居民月平均收入数据如下表。1—11号省份为第一类,12—22号省份为第二类,23—28号省份为第三类,考察下列9个指标,判定29号广东、30号西藏属于哪种收入类型?X1:人均生活费收入X2:人均全民所有制职工工资X3:人均人均来源于全民标准工资X4:人均集体所有制工资X5:人均集体职工标准工资X6:人均各种奖金及超额工资X7:人均各种津贴X8:职工人均从工作单位得

3、到的其他收入X9:个体劳动者收入(单位:元/人)一、判别分析聚类分析分类俗语说,物以类聚、人以群分。但什么是分类的根据呢?比如,要想把中国的县分成若干类,就有很多种分类法:可以按照自然条件来分,比如考虑降水、土地、日照、湿度等各方面;也可以考虑收入、教育水准、医疗条件、基础设施等指标;既可以用某一项来分类,也可以同时考虑多项指标来分类。聚类分析对于一个数据,人们既可以对变量(指标)进行分类(相当于对数据中的列分类),也可以对观测值(事件,样品)来分类(相当于对数据中的行分类)。比如学生成绩数据就可以对学生按照理科或文科成绩(或者综

4、合考虑各科成绩)分类,当然,并不一定事先假定有多少类,完全可以按照数据本身的规律来分类。对变量的聚类称为R型聚类,而对观测值聚类称为Q型聚类。这两种聚类在数学上是对称的,没有什么不同。例2:1991年5省城镇居民均消费(单位:元/人)X1X2X3X4X5X6X7X8辽宁7.9039.778.4912.9419.2711.052.0413.29浙江7.6850.3711.3513.3019.2514.592.7514.87河南9.4227.938.208.1416.179.421.559.76甘肃9.1627.989.019.321

5、5.999.101.8211.35青海10.0628.6410.5210.0516.188.391.9610.81二、样品聚类三、变量聚类例3:对一个班同学的各科成绩进行聚类,分析哪些课程是属于一个类的。学号数学物理语文政治199.0098.0078.0080.00288.0089.0089.0090.00379.0080.0095.0097.00489.0078.0081.0082.00575.0078.0095.0096.00660.0065.0085.0088.00779.0087.0050.0051.00875.0076.

6、0088.0089.00960.0056.0089.0090.0010100.00100.0085.0084.00四、快速聚类例4:从12个不同地区测得了某树种的平均发芽率X1与发芽势X2(数据见下页),将这12个地区以树种发芽情况按快速聚类法聚为两类。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。