多元统计分析 第6章(聚类分析)课件.ppt

多元统计分析 第6章(聚类分析)课件.ppt

ID:57113417

大小:2.55 MB

页数:193页

时间:2020-07-31

多元统计分析 第6章(聚类分析)课件.ppt_第1页
多元统计分析 第6章(聚类分析)课件.ppt_第2页
多元统计分析 第6章(聚类分析)课件.ppt_第3页
多元统计分析 第6章(聚类分析)课件.ppt_第4页
多元统计分析 第6章(聚类分析)课件.ppt_第5页
资源描述:

《多元统计分析 第6章(聚类分析)课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第六章聚类分析“物以类聚,人以群分”1聚类分析的实际案例老师要了解学生数学知识的掌握情况,该如何做?考试分析试卷将学生分类,每类给予相应的辅导2判别分析:对总体的信息有一定的了解,比如知道一些训练样本的情况.聚类分析:没有总体的信息,也不知道应该分成几类.判别分析和聚类分析的区别:3§6.1引言§6.2距离与相似系数§6.3系统聚类法§6.4动态聚类法§6.5有序样品聚类法§6.6变量聚类法4利用SAS帮助系统找到聚类分析方法的使用说明和例子的路径:聚类分析方法的帮助路径:帮助(H)→SAS帮助和文档(H)→SAS产品→SAS/stat→SAS/stat

2、User’sGuide→IntroductiontoClusteringProcedures5§6.1引言聚类分析要解决的问题:事先不知道所研究的问题应分为几类,更不知道观测到的个体的具体分类情况,我们的目的正是需要通过对观测数据所进行的分析处理,选定一种度量个体接近程度的统计量、确定分类数目、建立一种分类方法,并按亲近程度对观测对象给出合理的分类.6(系统)聚类分析的关键步骤:指标的选取样品之间距离的刻画类与类之间距离的刻画确定最终的分类个数78R型聚类分析的目的:(1)对变量进行分类;(2)可以了解变量间及变量组合间的亲疏关系;(3)根据分类结果及它

3、们之间的关系,在每一类中选择有代表性的变量作为重要变量,利用少数几个重要变量进一步作分析计算,如进行回归分析、判别分析或Q型聚类分析.9Q型聚类分析的目的:(1)对观测进行分类;(2)找出每类的特点以指导具体的实际工作.10§6.2距离与相似系数描述观测(变量)的亲疏关系的常用量有:距离相似系数.11变量定性变量定量变量名义变量有序变量区间变量比例变量变量分类(Stevens):12一、样品间的距离和相似系数n个观测看成m维空间中的n个点,用dij表示样品X(i)和X(j)之间的距离,要求:样本与样品131.闽科夫斯基(Minkowski)距离14(1)

4、绝对值距离15(2)欧氏距离16(3)切比雪夫距离172.兰氏距离(要求xij>0,LanceandWilliams)特点:(1)一个无量纲的量(2)对大的奇异值不敏感183.马氏距离(Mahalanobis)特点:考虑了变量之间的相关性一个无量纲的量(3)所有观测用同一个协差阵S效果不好,使用不便194.斜交空间距离其中rkl为变量Xk和Xl之间的相关系数.20二、变量间的相似系数和距离设Cij表示变量Xi和Xj之间的相似系数,要求:211.夹角余弦222.相关系数相关系数就是对数据作标准化处理后的夹角余弦.233.变量间的距离(1)利用相似系数来定义

5、变量间的距离24(2)利用样本协差阵来定义变量间的距离(3)利用前面定义样品的距离公式来定义变量间的距离254.特殊定性变量间的距离定义的一个例子案例1欧洲各国的语言有许多相似之处,有的十分相似,为了研究这些语言之间的关系,我们先来计算这十一种语言之间的距离.英语(EnglishE)、挪威语(NorwegianN)、丹麦语(DanishDa)、荷兰语(DutchDu)、德语(GermanG)、法语(FranchFr)、西班牙语(SpanishSp)、意大利语(ItalianI)、波兰语(PolishP)、匈牙利语(HungarianH)、芬兰语(Finn

6、ishFi).26EnglishNorwegianDanishDutchGermanFranchSpanishItalianPolishHungarianFinnishoneeneneeneinununounojedenegyyksitwotototweezweideuxdosduedwakettokaksithreetretredriedreitroistrestretrzyharomkolmefourfirefireviervierquatrecuatroquattroczterynegyneuafivefemfemvijffunfcinqcinco

7、cinquepiecotviisisixsekssekszessechssixseixseiszeschatkuusisevensjusyvzcvensiecnseptsietesettesiedemhetseitsemaneightatteotteachtachthuitochoottoosiemnyolckahdeksanninenininegenneunneufnuevenovedziewieckilencyhdeksantentititienzehndixdiezdiecidziesiectizkymmenen27用两种语言的10个数词中的第一个

8、字母不相同的个数来定义这两种语言之间的距离.28ENDaDuGFrSpIPHFi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。