《高级生物统计》课程讲义教案-第八讲聚类分析

《高级生物统计》课程讲义教案-第八讲聚类分析

ID:32661946

大小:75.90 KB

页数:10页

时间:2019-02-14

《高级生物统计》课程讲义教案-第八讲聚类分析_第1页
《高级生物统计》课程讲义教案-第八讲聚类分析_第2页
《高级生物统计》课程讲义教案-第八讲聚类分析_第3页
《高级生物统计》课程讲义教案-第八讲聚类分析_第4页
《高级生物统计》课程讲义教案-第八讲聚类分析_第5页
资源描述:

《《高级生物统计》课程讲义教案-第八讲聚类分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第九讲聚类分析聚类分析(ClusterAnalysis)是利用多个变量对样品或变量进行分类的一•种多元统计方法,在生物学、经济学、人口学、地质学、生态学等方而有广泛的应用。基本知识:一、聚类分析的含义:聚类分析(ClusterAnalysis)是利用多个样品或多个观测指标(变量)对样品或指标进行分类的一种多元统计方法。二.适宜资料:多个样品的多个观测指标待分类的数据。三、分析目的:利用多个样品的多个观测指标(变量),从量的介度对客观事物进行分类,从而揭示不同事物的数虽:本质及其差显,弥补定性分类综合性及客观性不强的弱点。四、基本思想:所研究的样品或指标(变量)Z间存在程度不

2、同的相似性或亲疏关系,关系近的聚为一类,关系远的聚为另外一类。第一节聚类分析的种类.距离系数法和相似系数法一、聚类分析的种类依据分类对象分为对对样品进行分类的Q型聚类和对变信息聚类、图论聚类、概率聚类、动态聚类、最优分割等方法,本章重点介绍系统依据分类统计量冇距离法和相似系数法。虽或指标进行分类的R型聚类两种;依据分类的数学方法常见的冇系统聚类、模糊聚类、灰色聚类、聚类法;二、分类统计量所谓分类统计量就是能够表示样品或指标间相似程度的数量,或是用來划分类型的数量指标。常用的分类统计量有距离系数和相似系数。三、距离系数法把每一个样品看成m维空间的一个点(m是样品的指标的个数)

3、,这样就可以把研究样品间的关系变为研究m维空间点与点之间的关系,而点与点之间的关系常用距离來表示,并根据点与点之间的距离进行分类,即将距离较近的点归为一类,而将距离较远的点归为不同的类。四、相似系数法越是比较相近的样品,它们的相似系数的绝对值越接近于1,而彼此无关的样晶它们的相似系数的绝对值越接近于0。这样就可以根据相似系数的数值,把彼此相似的样品(或变量)归为一类,而把不相似的样品(或变虽)归为不同的类。第二节距离的含义设有N个样品,每个样品观测m个变量,且设勺为观测到的第i个样站笫丿个变量的观测值,显然每个样站也是m维空间的一个向量,如果记作则有%)a=l>2、X“可以

4、看成m维空间的一个点,称为样木点,于是研究样品间聚类问题就可以通过点与点Z间的距离关系进行研究。如果用d可表示第z•个样品Xi与第丿•样品XjZ间的距离,常用的距离冇以下5种:m一、绝对值距离二.欧氏距离a~Xik~Xjkk=(9.1)(9.2)欧氏距离应用的綾多,但是它的缺点是它与变量取值的量纲(即测量单位)冇关,当改变测量单位时,计算出的距离系数可能不同。为此通常将数据进行标准化离差转换后再进行(9.3)分析,转换公式为X;j=i=1、2、…、N(9.4)三.明氏距离工卜从—Xjkk=(9.5)显然当q=l时,即为绝对值距离,当q=2时,即为欧氏距离,所以前两者均

5、为明氏距离的特姝情况。四、切比雪夫距离

6、,xmi)与Xj=(xlj,x2j,……,xmj)的夹角如果记作%,贝9它们的余玄为cos铲产尸」XtX*XjXjN(9.9)二、相关系数(9.10)N工(心-冇J工(兀幻•-兀)2k=Vk=第四节系统聚类方法(HierarchicalClusteringMethod)一、系统聚类方法的基本思想从一批样品的多个观测指标(变量)中,找出能度量样品间相似程度的统计量,以这些统计量作为划分类型的依据,把一些相似程度较人的样品聚为一类,另外一些彼此Z间相似程度较大的样品聚合为另外一类,……。关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的样品都聚

7、合完毕,把不同的类型一一划分出來,形成-个由小到大的分类系统,最后再把整个分类系统画成一张分群图(又称谱系图),用它把所有样品间的亲疏关系表示出来。二、系统聚类方法的分析思路先将每一个样品各自看成一啖,然后定义样品间的距离(或相似系数)和类与类间的距离。聚类过程是首先选择原离最小的两类将其合并成一新类(如果样殆间关系采用相似系数,则应选择相似系数绝对值最人的两类首先合并),再按类间距离的定义,计算新类与其它类间的距离,再将距离最近两类合并,如此继续,这样每次减少一类,在至所有样品都聚为一类为止。三、系统聚类的方法类

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。