欢迎来到天天文库
浏览记录
ID:43651185
大小:41.51 KB
页数:26页
时间:2019-10-11
《聚类分析的SPSS分析方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、用SPSS作聚类分析SPSS作聚类分析以经济效益数据为例,用聚类分析法对各省市作分类(见spssex・4/全国各省市经济效益数据)以城镇用民消费资料为例,用聚类分析法对各省市作分类(见spssex-4/城镇居民消费支出资料)SPSS屮的聚类分析小的聚类分析Spss屮的聚类功能常用的有两种:快速聚类(迭代过程):K-MeansCluster系统聚类:HierarchicalClusterHierarchicalCluster聚类系统聚类由两种方法:分解法和凝聚法。系统聚类的功能:即可进行样品的聚类,也可进行变量的聚类。系统聚类的原理:即我们前面介绍过的系统聚类方法的原理和过程。系统聚类的小
2、要进行以下的选择:数据的标准化测度方法的选择:距离方法的选择或相似性、关联程度的选择。聚类方法的选择:即以什么方法聚类,SPSS屮提供了7中方法可进行选择。输出图形的选择:树形图或冰柱图。系统聚类见(一)聚类方法见(二)各种距离和相似系数Method聚类方法亲疏关系指标标准化变换(一)聚类方迟1.Between-groupslinkage类间平均法两类距离为两类元素两两Z间平均平方距离2.Within-groupslinkage3.Nearestneighbor4.Furthestneighbor5.Centroidclustering6.Medianclustering7.WardMe
3、thod类内平均法最短距离法最长距离法重心法屮间距离法离差平方法(欧式距离)(欧式距离)(欧式距离)两类距离为合并后类中可能元索两两之间平均平方距离(二)各种距离和相似系数(亲疏关系扌号标)各种距离和相似系数(亲疏关系指标)1.squaredeuclideandistance平方欧式距离d(x,y)=工(xi?yi)i22.euclideandistance欧式距离d(x,y)3.cosine=工(xi?yi)i2夹角余弦(R型)皮尔逊相关系数(R)切比雪夫距离4.pearsoncoirelation5.chebychevd(x,y)=Maxx?yiii6.block绝对值距离d(x,y
4、)=Xxi?yii7.minkowski明考斯基q?1q(x,y)=?》xi?yid??i??8.customized(x,y)二?》xi?yid?i???q?1rStatistics聚类进度表相似矩阵样品或变量的分类情况AgglomerationScheduleClusterCombinedCluster1Cluster238141591635612713911410374142634392312StageClusterFirstAppearsCluster1Cluster200000010000030004682059101271113014Stage1234567891011121
5、31415Coefficients.466.8241.5831.6042.0542.5223.0394.1364.2454.9245.4607.1427.5209.61512.734NextStage4107911913101212141314150凝聚状态表的第一列表示聚类分析的第几步;第二列、第三列表示本步聚类小哪两个样本或小类聚成一类;第四列是相应的样本距离或小类距离;第五列、第六列表明木步聚类中,参与聚类的是样木还是小类。0表示样木,数字n(非0)表示由第n步聚类产牛的小类参与木步聚类;第七列表示木步聚类的结果将在下面聚类的第几步中用到。Plot树状结构图冰柱图冰柱的方向X5XX
6、XXXXXXXXXXX4XXXXXXXXXXXX3XXXXVerticalIcicleCaseNumberofclusters123456677X7XXXXXXXXXXXXXXXX6XXXXXXXXXXXXXX8XXXXXXXXXXXXXXX2XXXXXXXXX1XXXXXXX冰柱图因其样子非常彖冬天房顶垂下的冰柱得名,它以图形的方式显示层次聚类分析结果,一般从冰柱图的最后一行开始观察,第一列表示类数。两样品之间的“X”表示将其两边的样品(类)联结起來聚成新类。应用举例:应用举例:4-1首先对表4-1'
7、'的原始数据进行标准化变换处理,经过运算使数据标准化得到表4・2,使它的每列数据的平
8、均值为0,方差为1,这样表4・1中5列具有不同量纲、不同数量级的数据就能放在一起比较;其次用表4・2中经过标准化处理后的30个不同地区数据求出欧氏距离。表4・1表4・2K-MeansCluster聚类K-MeansCluster原理首先,选择n个数值型变量参与聚类分析,最后要求的聚类数为k个;其次,由系统选择k个(聚类的类数)观测量(也可由用户指定)作为聚类的种了。第三,按照距离这些类中心的距离最小的原则把所有观测量(样品)分派到各
此文档下载收益归作者所有