欢迎来到天天文库
浏览记录
ID:39436937
大小:27.50 KB
页数:8页
时间:2019-07-03
《引用 基于SPSS的聚类分析的实用方法(层次聚类法和迭代聚类法)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、引用基于SPSS的聚类分析的实用方法(层次聚类法和迭代聚类法)引用qjzhen001的基于SPSS的聚类分析的实用方法(层次聚类法和迭代聚类法)基于SPSS的聚类分析的实用方法(层次聚类法和迭代聚类法)层次聚类法和迭代聚类法的主要区别在于:层次聚类法的聚类结果受奇异值的影响非常大,且聚类过程是单方向的,一旦某个样本进入某一类,就不可能从该类出来,再归入其他的类;迭代聚类法的聚类结果受奇异值和不合适的聚类变量的影响较小,对于不合适的初始聚类可以进行反复调整,但其缺点是聚类结果对初始聚类非常敏感,而
2、且它也只能得到局部最优解.(一)层次聚类Analyze-->C1assify-->Hierachical8Cluster在“C1uster”组中选择聚类类型:要进行变量聚类选择指定“Vanables”;要进行观测量聚类指定“Cases”。指定参与分析的变量,将选定的变量通过按钮箭头转移到箭头按钮右侧的“Variable[s]:”矩形框中;将标识变量通过下面一个箭头按钮转移到按钮右侧的“LabelCasesby:”下面的矩形框中。如果不使用系统默认值,或由于参与分析的变量量纲不一致需要指定选择项,
3、则应该根据需要有选择性地执行下述某些步骤。1.确定聚类方法在主对话框中,点击“Methed”按钮,展开分层聚类分析的方法选择对话框,即“HierachicalClusterAnalysis:Method”。在对话框中根据需要指定聚类方法、距离测度的方法、对数值进行转换方法,即标准化数值的方法和对测度的转换方法。(1)聚类方法选择“C1usterMethod:”表中列出可以选择的聚类方法:Between-groupslinkage组内连接Within-groupslinkage组内连接Neares
4、tneighbor最近邻法Furthestneighbor最远邻法Centroid8clustering重心聚类法Medianclustering中位数法Ward’smethodWard最小方差法。(后三种聚类方法应与欧氏距离平方法一起使用)几种方法的具体情况见下面的英文文档(2)对距离的测度方法选择在Method中指定的是用哪两点间的距离的大小决定是否合并两类。距离的具体计算方法还根据参与距离的变量类型从以下三种对话框选择其一,展开选择菜单后再进行具体方法的选择。这三个对话框分别对应于等间隔测
5、度的变量(一般为连续变量)、计数变量(一般为离散变量)和二值变量。这里只考虑连续变量的情况“Interval”(系统默认)Euclideandistance:Euclidean距离,即两观察单位间的距离为其值差的平方和的平方根,该技术用于Q型聚类;SquaredEuclideandistance:Euclidean距离平方,即两观察单位间的距离为其值差的平方和,该技术用于Q型聚类;Cosine:变量矢量的余弦,这是模型相似性的度量;Pearson8correlation:相关系数距离,适用于R型
6、聚类;Chebychev:Chebychev距离,即两观察单位间的距离为其任意变量的最大绝对差值,该技术用于Q型聚类;Block:City-Block或Manhattan距离,即两观察单位间的距离为其值差的绝对值和,适用于Q型聚类;Minkowski:距离是一个绝对幂的度量,即变量绝对值的第p次幂之和的平方根;p由用户指定Customized:距离是一个绝对幂的度量,即变量绝对值的第p次幂之和的第r次根,p与r由用户指定。(3)确定标准化的方法:“TransformValue”“Standard
7、ize”下为标准化列表对数据进行标准化的可选择的方法有:①None不进行标准化,是系统默认值。②Zscores把数值标准化到Z分数。③Range-1tol把数值标准化到-1到+l范围内。选择该项,对每个值用变量或观测量的值的范围去除。如果值范围是0,所有值保持不变。④Maximummagnitudsof1把数值标准化到最大值为1。该方法是把正在标准化的变量或观测量的值用最大值去除。如果最大值为0,则改用最小值去除,其商加1。⑤Range0to1把数值标准化到0到1的范围内,对正在被标准化的变量或
8、观测量的值剪去最小值,然后除以范围。如果范围是0,对变量或观测量的所有值都设置成0.5。⑥Meanof1把数值标准化到一个均值的范围内,对正在被标准化的变量或观测量的值除以这些值的均值。如果均值是0,对变量或观测量的所有值都加1,使其均值为1。⑦Standarddeviationof18把数值标准化到单位标准差。该方法对正在被标准化的变量或观测量的值除以这些值的标准差,如果标准差为0,则这些值保持不变。(4)测度的转换方法选择对距离测度数值进行转换,在距离计算完成后进行。可选择的转换方法有三种,
此文档下载收益归作者所有