第12讲 聚类分析(1).ppt

第12讲 聚类分析(1).ppt

ID:61796836

大小:2.20 MB

页数:61页

时间:2020-02-06

第12讲 聚类分析(1).ppt_第1页
第12讲 聚类分析(1).ppt_第2页
第12讲 聚类分析(1).ppt_第3页
第12讲 聚类分析(1).ppt_第4页
第12讲 聚类分析(1).ppt_第5页
资源描述:

《第12讲 聚类分析(1).ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第十一讲聚类分析ClusterAnalysis(1)8/6/20211西南科技大学生命科学与工程学院周海廷制作聚类分析也是一种分类技术。与多元分析的其他方法相比,该方法较为粗糙,理论上还不完善,但应用方面取得了很大成功。与回归分析、判别分析一起被称为多元分析的三大方法。5.1基本概念8/6/20212西南科技大学生命科学与工程学院周海廷制作5.1.1聚类的目的根据已知数据,计算各观察个体或变量之间亲疏关系的统计量(距离或相关系数)。根据某种准则(最短距离法、最长距离法、中间距离法、重心法),使同一类内的差别较小,而类与类之间的差别较大,最终将观察个体或变量分为若干类。8/6/202

2、13西南科技大学生命科学与工程学院周海廷制作5.1.2聚类分析的应用例子同一种疾病(如肝炎),根据临床表现等将病人分成若干类(甲、乙、丙、丁、戊型肝炎)根据疾病的若干临床表现,将病人分成轻、中、重三型在儿童生长发育研究中,把以形态学为主的指标归于一类,以机能为主的指标归于另一类8/6/20214西南科技大学生命科学与工程学院周海廷制作5.1.3聚类的种类根据分类的原理可将聚类分析分为:系统聚类与快速聚类根据分类的对象可将聚类分析分为:系统Q型与R型(即样品聚类clusteringforindividuals与指标聚类clusteringforvariables)8/6/20215西

3、南科技大学生命科学与工程学院周海廷制作5.1.4聚类分析数据格式k8/6/20216西南科技大学生命科学与工程学院周海廷制作5.1.5.判别分析数据格式8/6/20217西南科技大学生命科学与工程学院周海廷制作5.1.6聚类分析与判别分析间的联系先采用聚类分析获得各个个体的类别(classification);然后采用判别分析建立判别函数,对新个体进行类型识别((identification)8/6/20218西南科技大学生命科学与工程学院周海廷制作5.2图示法聚类分析8/6/20219西南科技大学生命科学与工程学院周海廷制作5.2.1.散点图(Scatterdiagrams)8/

4、6/202110西南科技大学生命科学与工程学院周海廷制作5.2.2.轮廓图(Profilediagram)8/6/202111西南科技大学生命科学与工程学院周海廷制作5.3距离与相似系数8/6/202112西南科技大学生命科学与工程学院周海廷制作5.3.1距离假使每个样品有p个变量,则每个样品都可以看成p维空间中的一个点,n个样品就是p维空间中的n个点,则第i样品与第j样品之间的距离记为dij8/6/202113西南科技大学生命科学与工程学院周海廷制作1.欧式(Euclidian)距离8/6/202114西南科技大学生命科学与工程学院周海廷制作1.1二维空间欧式距离8/6/2021

5、15西南科技大学生命科学与工程学院周海廷制作1.2欧式距离的平方8/6/202116西南科技大学生命科学与工程学院周海廷制作2.明氏(Minkowski)距离SPSS称为BLOCK8/6/202117西南科技大学生命科学与工程学院周海廷制作实例计算品8/6/202118西南科技大学生命科学与工程学院周海廷制作绝对值距离8/6/202119西南科技大学生命科学与工程学院周海廷制作Euclidian距离的平方8/6/202120西南科技大学生命科学与工程学院周海廷制作Euclidian距离8/6/202121西南科技大学生命科学与工程学院周海廷制作变量标准化作用:消除量纲的影响8/6/

6、202122西南科技大学生命科学与工程学院周海廷制作3.Mahalanobis距离8/6/202123西南科技大学生命科学与工程学院周海廷制作Mahalanobis距离优点:马氏距离既排除了各指标间的相关性干扰,又消除了各指标的量纲缺点:样品协方差矩阵不变不合理。8/6/202124西南科技大学生命科学与工程学院周海廷制作Mahalanobis距离实例8/6/202125西南科技大学生命科学与工程学院周海廷制作4.Lance和Williams距离8/6/202126西南科技大学生命科学与工程学院周海廷制作5.斜交空间距离可考虑变量间相关性问题8/6/202127西南科技大学生命科学

7、与工程学院周海廷制作6.配合距离适用于分类变量,尤其是名义尺度变量8/6/202128西南科技大学生命科学与工程学院周海廷制作5.3.2相似系数研究样品间的关系常用距离,研究指标间的关系常用相似系数。相似系数常用的有:夹角余弦与相关系数8/6/202129西南科技大学生命科学与工程学院周海廷制作1.夹角余弦(Cosine)8/6/202130西南科技大学生命科学与工程学院周海廷制作2.Pearson相关系数8/6/202131西南科技大学生命科学与工程学院周海廷制作5

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。