ch03聚类分析应用

ch03聚类分析应用

ID:43705446

大小:240.50 KB

页数:42页

时间:2019-10-13

ch03聚类分析应用_第1页
ch03聚类分析应用_第2页
ch03聚类分析应用_第3页
ch03聚类分析应用_第4页
ch03聚类分析应用_第5页
资源描述:

《ch03聚类分析应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第三章聚类分析在区域经济中应用聚类分析方法SPSS的聚类分析过程系统聚类法总结案例分析-重庆市区市县经济分类3.1.1聚类分析概述聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即是在没有先验知识的情况下进行的。基本思想是根据事物本身的特性研究个体分类的方法;聚类原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。第一节聚类分析方法基本程序:是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行

2、归类。具体进行聚类时,由于目的、要求不同,因而产生各种不同的聚类方法:按样本聚类(Q)、按指标聚类(R)静态聚类法、动态聚类法层次聚类法、迭代聚类法、快速聚类法(K均值聚类)第一节聚类分析方法数据量纲不同将影响聚类分析的结果,处理方法是对其进行无量纲化处理。所谓无量纲化处理,是将原始数据中每个元素按照某种特定的运算把它变成一个新值,且是数值的变化不依赖于原始数据中其它数据的新值。对于间距尺度、有序尺度和名义尺度数据其处理方法不同,一般情况下,用于聚类分析的变量多为间距尺度。3.1.2原始数据处理方法有序尺度数据的无量纲化对于有序尺度,可以采用数值编码的方式将其转换为间距型。如:优、良、中

3、、及格、不及格54321小学、初中、高中、大专、本科以上691215163.1.2原始数据处理方法间距型数据无量级化(消除单位不同和数量级的影响)考虑:部分成绩用5分值,部分成绩用100分值,比较不同学生差异会出现什么情况?聚类结果将受到数据量级较大的变量的影响,而数据量级较小的变量基本不能发挥作用。3.1.2原始数据处理方法3.1.2原始数据处理方法1、标准化变换2、极差正规化(规格化变换、阈值法)3、功效系数法4、相对化变换3.1.3相似性测度即是把相似的样本分在一起,测量相似性的方法称为相似性测度,可以从距离和相关性来分析。概述:设有n个样本单位,每个样本测得p项指标(变量),原始

4、资料阵为:3.1.3相似性测度距离测度把n个样本点看成p维空间的n个点1、明考斯基距离(1)绝对距离(Block距离)(2)欧氏距离(Euclideandistance)3.1.3相似性测度(3)切比雪夫距离(Chebychev)2、兰氏距离消除量纲影响,但没有考虑相关性。3.1.3相似性测度3、马氏距离两点之间的马氏距离3.1.3相似性测度前述距离都针对间隔尺度,对于有序或名义尺度只能采用另外的方法。如对语言相似性进行分析,可以采用首音节的相似性作为不比较基础。3.1.3相似性测度对于变量的聚类,一般不能进行距离分析,只能采用相似性度量。对两个指标之间的相似程度用相似系数来刻划,相似系

5、数的绝对值越接近于1,表示指标间的关系越密切,绝对值越接近于0,表示指标间的关系越疏远。3.1.3相似性测度1、夹角余弦2、相关系数3、同号率3.1.4类与类的距离类的含义类通常用G表示,其中包含k个元素,用i,j表示。给定一值T,类中任意元素距离小于等于T。类间距离---八种测量方法最短距离法、最长距离法、中间距离法重心距离法、类平均法、可变类平均法可变法、Ward离差平方和3.1.5层次(系统)聚类法系统聚类法(层次聚类法):在聚类分析的开始,每个样本自成一类;然后,按照某种方法度量所有样本之间的亲疏程度,并把最相似的样本首先聚成一小类;接下来,度量剩余的样本和小类间的亲疏程度,并将

6、当前最接近的样本或小类再聚成一类;再接下来,再度量剩余的样本和小类间的亲疏程度,并将当前最接近的样本或小类再聚成一类;如此反复,直到所有样本聚成一类为止。步骤:1、对数据进行变换处理,消除量纲2、构造n个类,每个类只包含一个样本计算3、计算n个样本两两间的距离{dij}4、合并距离最近的两类为一新类5、计算新类与当前各类的距离,重复(4)6、画聚类图7、决定类的个数和类第四节系统聚类法SPSS采用的求新类方法一、最短距离法二、最长距离法三、中间距离法四、重心距离法五、组间链接法(默认)(类平均法)六、组内连接法(类平均法)七、Ward离差平方和最短距离法(NearestNeighbor)

7、以当前某个样本与已经形成的小类中的各样本距离中的最小值作为当前样本与该小类之间的距离。省份x1x2x3x4x5x6x7x8辽宁浙江河南甘肃青海7.907.689.429.1610.0639.7750.3727.9327.9828.648.4911.358.209.0110.5212.9413.308.149.3210.0519.2719.2516.1715.9916.1811.0514.599.429.108.392.042.751

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。