欢迎来到天天文库
浏览记录
ID:2080544
大小:344.86 KB
页数:16页
时间:2017-11-14
《matlab、lingo程序代码12-聚类分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、SPSS19.0实战之聚类分析 这篇文章与上一篇的回归分析是一次实习作业整理出来的。所以参考文献一并放在该文最后。CNBlOG网页排版太困难了,又不喜欢livewriter……聚类分析是将物理或者抽象对象的集合分成相似的对象类的过程。本次实验我将对同一批数据做两种不同的类型的聚类;它们分别是系统聚类和K-mean聚类。其中系统聚类的聚类方法也采用3种不同方法,来考察对比它们之间的优劣。由于没有样本数据,因此不能根据其数据做判别分析。评价标准主要是观察各聚类方法的所得到的类组间距离和组内聚类的大小。 分析数据依然采用线性回归所使用的标准化后的能源消费数据。1.1系统聚类 本次实验的
2、系统聚类都是凝聚系统聚类,为了控制变量,都采用平方Euclidean距离。1.1.1最短距离聚类法最短距离法聚类步骤如下:·规定样本间的距离,计算样本两两之间的距离,得到对称矩阵。开始每个样品自成一类。·选择对称矩阵中的最小非零元素。将两个样品之间最小距离记为D1,将这两个样品归并成为一类,记为G1。·计算G1与其他样品距离。重复以上过程直到所有样品合并为一类。我们在SPSS中实现最短距离分析非常简单。单击“”-->“”-->“”。将弹出如图1-1所示的对话框,设置相应的参数即可。 图1-1最短距离法我们的数据已经做过标准化,在“转化值”-->“标准化”选项上选无。在统计量的聚类成员中
3、选择“无”,因为这是非监督分类,不需要指定最终分出的类个数。在绘制中选择绘制“树状图”。单击确定,得到以下结果。·表3-1显示了数据的缺失情况: 案例处理汇总a案例有效缺失总计N百分比N百分比N百分比30100.00.030100.0表1-1数据汇总我们的数据经过预处理,所以缺失值个数为0. 2.由于相关矩阵过于庞大,无法在文档中贴出,得到的是一个非相似矩阵。表1-2是样品聚类过程。样品21和28在第一步合并为一类,它们之间的非相关系数最小,为0.211。在下一次合并是第十步。在第五步的时候,样品2、27、14组成一
4、类,出现群集,样品个数为3。如上类推,可以解释表格。聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集212128.211001021224.4650063227.49100541320.5850095214.6453066212.678527727.7026088225.7737099213.91684111021291.0851012112181.1069012122211.115111013132171.36012014142261.56413015152221.6271401616251.6491501717281.87716018182163.0271701919
5、2303.54318020202114.9301902121245.02420022222106.4452102423198.26200262421510.093220252522310.09624026261210.189232527271611.38726028281313.153270292911932.3672800 表1-2聚类过程我们可以通过更加形象直观的树状图来观察整个聚类过程和聚类效果。如图1-2所示,最短距离法组内距离小,但组间距离也较小。分类特征不够明显,无法凸显各个省份的能源消耗的特点。但是我们可以看到广东省能源消耗组成和其他省份特
6、别不同,在其他方法中也显现出来。图1-2最短距离法聚类图1.1.2组间联接聚类组间联接聚类法定义为两类之间的平均平方距离,即。类CK和CL 合并为下一步的CM则CM 与CJ距离的递推公式为:。我们依然贴出组间联接法的聚类表和树状图。·聚类表如表1-3所示,相关解释类似于表1-1所述。 聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集212128.211001021224.4650053227.49100641320.5850085712.8400276214.9373077271.1056511813251.3314011917181.36000141021
7、291.4951013112131.7037815128261.87700151321222.13310018145172.378091615283.71511121616253.926151418174165.0240023182215.5261613211910116.445002220198.2620025212308.744180232261011.50801924232414.2022117252461514.288220272512
此文档下载收益归作者所有