[精品]聚类分析

[精品]聚类分析

ID:43778484

大小:89.82 KB

页数:4页

时间:2019-10-14

[精品]聚类分析_第1页
[精品]聚类分析_第2页
[精品]聚类分析_第3页
[精品]聚类分析_第4页
资源描述:

《[精品]聚类分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、聚类今祈聚类分析法:(此处只选用平均谱系聚类法)聚类分析也称群分析、点群分析,他是研究分类的一种多元统计方法。例如,我们可以根据学校的师资、设备、学生的情况,将大学分成一流大学,二流大学等;国家Z间根据其发展水平可以划分为发达国家、发展屮国家;1'1然界牛物可以分为动物和植物等等。这些就是一些分类。那么分类根据什么分呢?1、基本思想我们所研究的样品或指标(变量)Z间存在程度不同的相似性(亲疏关系)。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此Z间相似程度较大的样

2、品(或指标)又聚合为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的样品(或指标)聚合完毕,这就是分类的基本思想。以下我们学习一种常用的分类法称作系统聚类法。在聚类分析中,通常我们将根据分类对象的不同分为Q型聚类分析和R型聚类分析两大类。Q型聚类分析是对样木进行分类处理,R型聚类分析是对变量进行分类处理。R型聚类分析的主要作用是:1、不但可以了解个别变量之间的关系的亲疏程度,而且可以了解各个变量组合Z间的亲疏程度。2、根据变量的分类结果以及它们Z间的关系,可以选择主要变量进行回归分析或Q型聚类分析。Q型聚类分析的优点是:1、可以综合利用多个变量的信息

3、对样本进行分类;2、分类结果是肖•观的,聚类谱系图非常清楚地表现其数值分类结果;3、聚类分析所得到的结果比传统分类方法更细致、全而、合理。为了进行聚类分析,首先我们定义样品间的距离。2、距离设有n个样品,p个指标,数据矩阵为X]i,…,兀兀21,…,X2p元素X-.表示第i个样品的第j个指标。因每个样品有P个指标,故每个样品可以看成p维空间屮的一个点,n个样品就构成p维空间中的n个点。因此我们可以用距离来度量样品之间接近的程度。常用的距离:1)明氏(Minkowski)距离:P6=1当q二1时,为绝对距离;当q二2时,为欧氏距离;当q=3吋,为切比雪夫距离。当各变量的测量值相差悬殊时,采用

4、明氏距离并不合理,需要先对数据标粧化,然后用标准化后的数据计算距离。明氏距离特别是其屮的欧氏距离是人们较为熟悉的,也是使用最多的距离。但明氏距离存在不足Z处,主要表现在两个方而:第一,它与各指标的量纲有关;第二,它没有考虑指标Z间的相关性,欧氏距离也不例外。2)马氏距离:设工表示指标的协差阵即:血•⑷=(£

5、岳-%

6、)內a=l召=—工X冲Xj=_》x(ij=l,na=a=i如果工T存在,贝『两个样品之间的马氏距离为:d;(M)=(兀-®)工七-®)这里兀为样晶兀的个指标组成的向量,即原始资料阵的第i行向量。样品类似。»顺便给出样品X到总体G的马氏距离定义为:d2(X,G)=(X-“j「

7、(X-“)其中u为总体的旳值向量,X为协方差阵。马氏距离既排除了各指标Z间相关性的干扰,而口述不受各指标量纲的影响。除此Z外,它还有一些优点,如町以证明,将原数据作一线性交换后,马氏距离仍不变等等。2)兰氏距离:1pX-—X・此距离仅使用于一切©〉0的情况,这个距离有助于克服各指标Z间量纲的影响,但没有考虑指标之间的相关性。计算任何两个样品不与◎之间的距离给•,其值越小表示两个样品接近程度越人,d”•值越大表示两个样品接近程度越小。如果把任何两个样品的距离都算出来后,可排成距离阵D:d]],dp,…dAn〃21,“22,•••^2nD=.其中dH=^22=•••=<«=0。D是一个实对称阵

8、,所以只须计算上三角形部分或卞三角形部分即可。根据D可对n个点进行分类,距离近的点归为一类,距离远的点归为不同的类。3、相似系数1)夹角余弦将任何两个样品旳与◎看成P维空间的两个向量,这两个向量的夹角余弦用COS0表示。pXVja则cos0tj0

9、OS&2“cos^1,cos^2,...cos^l//_3l?

10、icosq产COS02二...=cos仇八H是一个实对称阵,所以只须计算上三用形部分或下三角形部分,根据H可对川个样品进行分类,把比较相似的样品归为一类,不怎么相似的样胡归为不同的类。2)相关系数通常所说相关系数,一般指变量间的相关系数,作为刻划样品间的相似关系也可类似给出定义,即第i个样品与第j个样品之间的相关系数定义为:其中无十拿一1和1实际上,&就是两

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。