欢迎来到天天文库
浏览记录
ID:41709588
大小:220.98 KB
页数:32页
时间:2019-08-30
《教育多元统计学与SPSS软件8聚类分析_图文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第八章聚类分析聚类分析是一种研究“物以类聚”问题的多元统计方法,按照一定的分类原则,将指标或样品聚为一类。第一节概述聚类分析根据分类对象的不同,分为R型聚类分析与Q型类分析两种。用于指标的分类用R型聚类分析,用于样品的分类用Q型聚类分析。聚类分析的基本思想:先将分类对象(指标或样品)各白看成一类,然后选择一个统计量来衡罐分类对象的札I似程度,根据其人小先将两两对象聚成一类,如此下去,玄至所有对彖都聚成一类(或预分的类)为止。将聚类的整个过程作成一张谱系图,然后根据实际问题的需要,选择一个合适的分类标准,便能得到所要分的类。聚类方法可单独使用
2、,也可与其它多元统计方法结合使用,如对先进行聚类分析,再进行多元回归分析或判別分析。对于R型聚类结果,需要选岀各类的代表性指标,称为典型指标。当一类中只有两个指标时,可以任选一个作为典型指标。当一歩中多于两个指标时,需耍计算相关指数F(相关系数的平方,也称判定系数)的平均数疋,将其值最人的指标作为典型指标。Er2莊——k-1其屮,r为类内指标之间的相关系数,k为类内的指标个数。1.聚类方法一般多元统计书上介绍8种方法:最短距离法:将两类样木间的最短距离作为类与类之间的距离,具有单调性,空间收缩很快。最长距离法:与最短距离法相反,将两类样本间
3、的最长距离作为类与类之间的距离,也具有单调性,聚类空间呈扩张状态。中间距离法:类间距离介于以上两种方法之间,聚类空间处于守衡状态,不能保证类距离总是单调的。重心法:上述3种方法在定义类间距离时均未考虑新类中所含样木点的多少,存在不合理之处,该方法可以纠正上述问题。与中间距离法类似,聚类空间守衡,不能保证类距离总是单调的。类平均法:为了更多地吸取类内样本点信息,定义类间距离为两类中样本点间距离平方的平均。该法空间守衡,又是单调的,是较为理想的系统聚类方法。可变类平均法:在计算类间距离的公式屮引入了聚集强度系数B(P<1),B取不同的值可能会得
4、到不同的聚类结果,选择合适的B值,以达到最佳聚类效果,一般认为取-1/4时效果较好。该方法仍具有单调性,比类平均法更为合理一些。可变法:将可变类平均法中的聚集强度系数0引进屮间距离法就形成了该方法。离差平方和法:又称Ward法,利用方差分析原理进行聚类。1.常用的数据变换方法屮心化变换、标准化变换、极差正规化变换、对数变换2.距离绝对值、欧氏、切比雪夫、兰氏、马氏、斜交空间3.和似系数积差相关系数、夹角余弦、指数相似系数第二节系统聚类法聚类方法有多种,如系统聚类、动态聚类、有序样品聚类及模糊聚类等,卜-而进行简耍介绍。系统聚类方法(也称分层
5、聚类方法):将p个指标(样品)看成p类,将性质最接近的两类聚成一个新类,得到p-l类,再从屮将性质最接近的两类聚成一个新类,得到P-2类,依此类推,直至所有的指标(样品)均聚为一类。动态聚类方法:先将指标(样品)粗略的分成若干类,然示根据某种最优原则进行调整,反复多次,宜至不能调整时为止。有序样品聚类方法:先将指标(样品)根据某种原因排成次序,要求次序相邻的指标(样品)聚成一类。模糊聚类方法:将模糊数学理论用于聚类分析屮产生的方法。本节结合SPSS软件介绍系统聚类方法。1.SPSS软件计算步骤选择"Analyze”-*■"Classify”
6、-*•"HierarchicalCluster"项。弹出如图8.2.1所示的对话框。1.1Variables栏存放聚类变罐。1.2LabelCasesby栏存放标识变量,如用指标名称、编号、姓名來标明各指标或样品最后聚到哪一类,不指定时,系统口动将序号作为标识变量。1.3Cluster选项①Cases对样品进行聚类,Q羽聚类。①Variables■HierarchicalClusterAnalysisffR012.M234567—8911—MlxxxxxxxxxxxA4yxyxVariable(s):LabelCasesby:QCluste
7、rACases〔•VariablesDisplayI?Statistics
8、7PlotsCancelHelpStatistics...Plots...Method...Save...图8.2.1分层聚类分析主对话框对指标进行聚类,R型聚类。1.4Display选项①Statistics输出统计量。②Plots输出图形。HierarchicalClusterAnalysis:Statistics1.5Statistics按钮29、one广S.inglesolutionNumberofclusters:WRangeofsolutionsMinimumnumberofclusters:Maximumnumbe
9、one广S.inglesolutionNumberofclusters:WRangeofsolutionsMinimumnumberofclusters:Maximumnumbe
此文档下载收益归作者所有