【9A文】聚类分析

【9A文】聚类分析

ID:39986551

大小:280.50 KB

页数:9页

时间:2019-07-16

【9A文】聚类分析_第1页
【9A文】聚类分析_第2页
【9A文】聚类分析_第3页
【9A文】聚类分析_第4页
【9A文】聚类分析_第5页
资源描述:

《【9A文】聚类分析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、【MeiWei_81重点借鉴文档】合肥学院2015-2016第二学期《多元统计分析》课程论文论文题目聚类分析姓名陈毅学号1307021036专业数学与应用数学(1)成绩2015.5聚类分析摘要:本论文为了研究南部海洋1970-1985年这15年20个站点的平均每年每月的表面空气温度数据分为几类最合适。用南部海洋1970-1985年20个站点的平均每年每月的表面空气温度数据中,所有数据两两数据间距离的平均作为类间距离,使用聚类分析中的最长距离法,运用SAS软件,从而得出相应的数据,分析数据即确定了南部海洋1970-19

2、85年这15年20个站点的平均每年每月的表面空气温度数据分为几类最合适。关键词:聚类分析最长距离法SAS软件分类一、聚类分析理论1、数据的变换方法(1)中心变换变换称为中心化变换。它是一种标准化处理方法,变换后数据的均值为0,而协方差阵不变,即协差阵为,其中。中心化变换是一种方便地计算样本协差阵的变换。【MeiWei_81重点借鉴文档】【MeiWei_81重点借鉴文档】(2)标准化变换变换称为标准化变换,变换后的数据,每个变量的样本均值为0,标准差为1,而且标准化变换后的数据与变量的量纲无关。(3)对数变换变换称为对

3、数变换,它可将具有指数特征的数据结构化为线性数据结构此外,还有平方根变换,立方根变换等。它们的主要作用是把非线性数据结构变为线性数据结构。称变换(4)极差标准化变换称变换称为极差标准化变换,变换后的数据,每个变量的样本均值为0,极差为1,且,在以后的分析计算中可以减少误差的产生;同时变换后的数据也是无量纲的量。5.极差正规化变换称变换为极差正规化变换。变换后的数据;极差也为1,同时变换后的数据也是无量纲的量。2、距离的定义1.闵科夫斯基(Minkowski)距离称【MeiWei_81重点借鉴文档】【MeiWei_81

4、重点借鉴文档】为闵科夫斯基距离。(1)绝对值距离:在上式中,当q=1时的一阶闵科夫斯基距离为称它为绝对值距离。(2)欧氏距离:取,就可以得到二阶闵科夫斯基距离为称它为欧氏距离。3、系统聚类法的思想(1)定义样品间的距离(或相似系数)和类与类之间的距离;(2)将n个样品各自自成一类,这时类间的距离与样品间的距离是等价的;(3)然后将距离最近的两类合并,并计算新类与其他的类间距离,再按最小距离准则并类。这样每次缩小一类,直到所有的样品都成一类为止。这个并类过程可以用谱系聚类图形像地表达出来4、系统聚类的步骤(1)数据变换

5、:可以使用上节介绍的方法对数据进行变换。数据变换目的是为了便于比较、计算上的方便或改变数据的结构。选择试题样品间距离的定义(如欧氏距离)及度量类间距离的定义。(2)计算n个样品两两间的距离,得样品间的距离矩阵。(3)一开始n样品各自构成一类,类的个数个类:,此时类间距离就是样品间的距离(即)然后对步骤执行并类过程(4)和(5).(4)每次合并类间距离最小的两类为一新类,此时类的总个数k减少到1类,即。【MeiWei_81重点借鉴文档】【MeiWei_81重点借鉴文档】(5)计算新类与其他类的距离,得到新的距离矩阵,若

6、合并后类的总个数k仍大于1,重复(4)和(5)步,直到类的总个数为1为止。(6)画谱系聚类图。(7)决定分类的个数及各类的成员。二、问题提出与分析现有南部海洋1970-1985年20个站点的平均每年每月的表面空气温度数据,请用聚类分析研究南部海洋1970-1985年这15年20个站点的平均每年每月的表面空气温度数据分为几类最合适。数据资料如下表所示:观测站点一月二月三月四月五月六月七月八月九月十月十一月十二月坎贝尔岛9.59.79.18.07.14.95.95.84.86.57.59.1Leeuwin19.920.0

7、19.017.515.814.913.912.812.914.115.017.5开普敦19.620.816.118.913.911.811.111.512.015.917.420.9查塔姆岛13.314.813.612.010.99.47.58.99.610.212.312.8克罗泽10.611.28.66.64.73.93.12.92.63.74.86.0戈夫岛14.014.012.712.810.99.39.19.29.210.112.314.5格瑞特威肯4.95.74.92.8-0.4-0.8-2.50.11.

8、52.03.93.2复活节岛23.023.322.821.721.518.919.218.017.919.621.220.5胡安费尔南德兹17.517.316.515.414.913.412.811.612.514.216.917.3凯尔盖朗8.59.37.26.63.41.32.02.62.53.45.27.1maatsuRker15.116

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。