欢迎来到天天文库
浏览记录
ID:48664031
大小:1.57 MB
页数:49页
时间:2020-01-18
《判别分析PPT.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、聚类分析与判别分析本章介绍统计学中经常使用的分类统计分析方法——聚类分析与判别分析。主要内容有层次聚类分析、快速聚类分析和判别分析。其中层次聚类分析根据聚类的对象不同分成Q型聚类和R型聚类。8.1聚类分析与判别分析的基本概念统计学研究这类问题的常用分类统计方法主要有聚类分析(clusteranalysis)与判别分析(discriminantanalysis)。其中聚类分析是统计学中研究这种“物以类聚”问题的一种有效方法,它属于统计分析的范畴。聚类分析的实质是建立一种分类方法,它能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。这里所说
2、的类就是一个具有相似性的个体的集合,不同类之间具有明显的区别。聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。因此我们说聚类分析是一种探索性的分析方法。对个案的聚类分析类似于判别分析,都是将一些观察个案进行分类。聚类分析时,个案所属的群组特点还未知。也就是说,在聚类分析之前,研究者还不知道独立观察组可以分成多少个类,类的特点也无所得知。变量的聚类分析类似于因素分析。两者都可用于辨别变量的相
3、关组别。不同在于,因素分析在合并变量的时候,是同时考虑所有变量之间的关系;而变量的聚类分析,则采用层次式的判别方式,根据个别变量之间的亲疏程度逐次进行聚类。聚类分析的方法,主要有两种,一种是“快速聚类分析方法”(K-MeansClusterAnaly-sis),另一种是“层次聚类分析方法”(HierarchicalClusterAnalysis)。如果观察值的个数多或文件非常庞大(通常观察值在200个以上),则宜采用快速聚类分析方法。因为观察值数目巨大,层次聚类分析的两种判别图形会过于分散,不易解释。判别分析是一种有效的对个案进行分类分析的方法。和聚类分析不同的是,
4、判别分析时,组别的特征已知。如银行为了对贷款进行管理,需要预测哪些类型的客户可能不会按时归还贷款。已知过去几年中,900个客户的贷款归还信誉度,据此可以将客户分成两组:可靠客户和不可靠客户。再通过收集客户的一些资料,如年龄、工资收入、教育程度、存款等,将这些资料作为自变量。通过判别分析,建立判别函数。那么,如果有150个新的客户提交贷款请求,就可以利用创建好的判别函数,对新的客户进行分析,从而判断新的客户是属于可靠客户类,还是不可靠客户类。8.5判别分析前面3节讲述了不同种聚类分析的方法,不论是哪种方法,聚类分析都是直接比较各事物之间的性质,将性质相近的归为一类,将
5、性质差别较大的归入不同的类。本节讲述的判别分析,也是一种比较常用的分类分析方法。判别分析先根据已知类别的事物的性质,利用某种技术建立函数式,然后对未知类别的新事物进行判断以将之归入已知的类别中。有学者在研究中提出,可以利用判别分析来对聚类分析结果的准确性进行检验。聚类分析分成几类后,即可以作为判别分析的类别输入,进行判断。定义:判别分析先根据已知类别的事物的性质(自变量),建立函数式(自变量的线性组合,即判别函数),然后对未知类别的新事物进行判断以将之归入已知的类别中。8.5.1统计学上的定义和计算公式判别分析有如下的假定:预测变量服从正态分布。预测变量之间没有
6、显著的相关。预测变量的平均值和方差不相关。预测变量应是连续变量,因变量(类别或组别)是间断变量。两个预测变量之间的相关性在不同类中是一样的。在分析的各个阶段应把握如下的原则:事前组别(类)的分类标准(作为判别分析的因变量)要尽可能准确和可靠,否则会影响判别函数的准确性,从而影响判别分析的效果。所分析的自变量应是因变量的重要影响因素,应该挑选既有重要特性又有区别能力的变量,达到以最少变量而有高辨别能力的目标。初始分析的数目不能太少。这些判别函数是各个独立预测变量的线性组合。程序自动选择第一个判别函数,以尽可能多地区别各个类,然后再选择和第一个判别函数独立的
7、第二个判别函数,尽可能多地提供判别能力。程序将按照这种方式,提供剩下的判别函数。判别函数的个数为k。图8-22判别分析的示意图研究问题调查了15个公司的组织文化、领导角色和员工发展3个方面内容作为预测变量,因变量为公司对员工的吸引力。为符合研究问题,将公司对员工的吸引力根据被测的实际填答情形,划分为高吸引力组(group=1)、中吸引力组(group=2)和低吸引力组(group=3)。数据如表8-4所示。8.5.2SPSS中实现过程表8-4不同类的不同公司特点公司组织文化领导角色员工发展GroupMicrosoft80.0075.0090.001IBM85.
此文档下载收益归作者所有