SPSS聚类分析.ppt

SPSS聚类分析.ppt

ID:49518583

大小:1.23 MB

页数:42页

时间:2020-02-06

SPSS聚类分析.ppt_第1页
SPSS聚类分析.ppt_第2页
SPSS聚类分析.ppt_第3页
SPSS聚类分析.ppt_第4页
SPSS聚类分析.ppt_第5页
资源描述:

《SPSS聚类分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第三讲聚类分析1聚类分析的基本思想聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类。基本思想是根据事物本身的特性研究个体分类的方法;聚类原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。2相似性度量进行“相关性”或“相似性”度量。在相似性度量中常常包含有许多主观上的考虑,但是最重要的是考虑指标性质或观测的尺度。当样品进行聚类时,“靠近”往往是距离。同时对指标进行聚类时,根据相关系数或某种关联性度量来聚类。Q型聚类统计量

2、(距离)3、明考斯基距离(Minkowski)1、绝对距离(Block距离)2、欧氏距离(Euclideandistance)可以验证,dij(q)满足距离的四条公理。但距离的大小与各指标的观测单位有关;而且没有考虑指标之间的相关性。改进的办法:4、切比雪夫距离(Chebychev)1、标准化变换2、兰氏距离3、马氏距离5.数据的标准化6、兰氏距离7、马氏距离例1已知一正态总体G的分布为求点和至均值的距离.由假设可算得从而如果用欧氏距离而按马氏距离相差19倍.点A和点B的密度分别是f(1,1)=0.2157和f(1,-1)=

3、0.00001658说明前者应当离均值较近,后者较远.例2欧洲各国的语言有许多相似之处,有的十分相似。为了研究这些语言的历史关系,也许通过比较他们数字的表达式比较恰当。表列举出英语,挪威语,丹麦语,荷兰语,德语,法语,西班牙语,意大利语,波兰语,匈牙利语和芬兰语的1,2,…,10的拼法,希望计算这11种语言之间的语言的距离.英语挪威语丹麦语荷兰语德语法语西班牙语OneeneneeneinununoTwotototweezweideuxdosThreetretredriedrietriostresFourfirefirevie

4、rvierquatrecuatroFivefemfermvifjfunfeinqcinoSixsekssekszessechssixseixSevensjusyvzevensiebcnseptsieteEightateoteacheachthuitochoNinenininegenneunneufneeveTentititienzehndixdiez1、夹角余弦2、相关系数R型聚类统计量对两个指标之间的相似程度用相似系数来刻划,相似系数绝对对值越接近于1,表示指标间的关系越密切,绝对值越接近于0,表示指标间的关系越疏远.当p

5、个指标是名义尺度时,例如p=6,有两个样品的指标的取值为:4系统聚类分析一系统聚类分析的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直下去,每个样品(或变量)总能聚到合适的类中。系统聚类分析过程是:假设总共有n个样品(或变量),第一步将每个样品(或变量)独自聚成一类,共有n类;第二步根据所确定的样品(或变量)“距离”公式,将距离较近的两个样品(或变量)聚合为一类,其他样品(或变量)仍各自聚为一类,共有n-1类;第三步将“距离”最近的两个类进一步聚成一类,共聚成n-2类;……以上步骤一直进行下去,最

6、后将所有的样品或变量)聚成一类。将整个分类系统地画成一张谱系图,所以有时系统聚类分析也叫谱系聚类分析。二类间距离首先定义类与类之间地距离,又类间的距离定义不同产生不同的系统聚类分析。常见的类间的距离有法。它们的归类步骤基本是一致的。8种之多,与之相应的系统聚类分析也有8种之多、分别为最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法和离差平方和2.1最短距离法(nearestneighbor或singlelinkagemethod)定义类与类之间的距离为两类最近样品的距离,即设类合并成一新类记为,则任

7、一类的距离为*最短距离法进行聚类分析的步骤如下:(1)定义样品之间的距离(2)找出距离最小元素,设为,则将合并成一新类记为,记为(3)按*式计算新类与其他类之间的距离。(4)重复(2),(3)的步骤,直到将所有元素并成一类为止。(如果某一步距离最小的元素不止一个,则将对应这些最小元素的类可以同时合并)例1设有6个样品,每个只测一个指标,分别是1,2,5,7,9,10,试采用绝对值距离用最短距离法将它们进行分类。解(1)样品首先采用绝对值距离,计算样品之间的距离阵为D(0).G1G2G3G4G5G6G10G210G3430G4

8、6520G587420G6985210D(0)G2={2}G1={1}G3={5}G4={7}G5={9}G6={10}G7G8G9G10123D2.2最长距离法(farthestneighbor或completelinkagemethod)定义类与类之间的距离为两类最远样品的距离,即最长

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。