最新8-聚类分析和主成分分析教学讲义ppt课件.ppt

最新8-聚类分析和主成分分析教学讲义ppt课件.ppt

ID:62064352

大小:6.08 MB

页数:113页

时间:2021-04-14

最新8-聚类分析和主成分分析教学讲义ppt课件.ppt_第1页
最新8-聚类分析和主成分分析教学讲义ppt课件.ppt_第2页
最新8-聚类分析和主成分分析教学讲义ppt课件.ppt_第3页
最新8-聚类分析和主成分分析教学讲义ppt课件.ppt_第4页
最新8-聚类分析和主成分分析教学讲义ppt课件.ppt_第5页
资源描述:

《最新8-聚类分析和主成分分析教学讲义ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、8-聚类分析和主成分分析“物以类聚,人以群分”,现实世界中存在大量的分类问题。一、什么是聚类分析?聚类分析(ClusterAnalysis)是物以类聚的一种统计分析法。用于对事物类别的面貌尚不清楚,甚至在事前连总共有几类都不能确定的情况下进行分类的场合。二、聚类分析的典型应用数据聚类分析是一个正在蓬勃发展的领域。聚类分析所涉及的领域包括:数据挖掘、统计学、机器学习、空间数据库技术、生物学和市场学等。由于各应用数据库所包含的数据量越来越大,聚类分析已成为数据挖掘研究中一个非常活跃的研究课题。作为统计学的一个分支,聚类分析

2、已有多年的研究历史,这些研究主要集中在基于距离的聚类分析方面。许多统计软件包,诸如:SAS、SPSS和S-PLUS等都包含它许多聚类分析工具。二、聚类分析的典型应用三、聚类分析应用解析例对10位应聘者做智能检验。3项指标X,Y和Z分别表示:X--数学推理能力,Y--空间想象能力和Z--语言理解能力。其得分如下,选择合适的统计方法对应聘者进行分类。应聘者12345678910X28181121262016142422Y29232223292322232927Z28181622262222242424我们直观地来看,这个分

3、类是否合理?计算4号和6号得分的离差平方和:(21-20)2+(23-23)2+(22-22)2=1计算1号和2号得分的离差平方和:(28-18)2+(29-23)2+(28-18)2=236计算1号和3号得分的离差平方和为482,由此可见一般,4号和6号类型接近。我们的问题是如何来选择样品间相似的测度指标,如何将有相似性的类连接起来?三、聚类分析应用解析四、变量测量尺度的类型间隔尺度。指标度量时用数量来表示,其数值由测量或计数、统计得到,如长度、重量、收入、支出等。一般来说,计数得到的数量是离散数量,测量得到的数量是

4、连续数量。在间隔尺度中如果存在绝对零点,又称比例尺度。顺序尺度。指标度量时没有明确的数量表示,只有次序关系,或虽用数量表示,但相邻两数值之间的差距并不相等,它只表示一个有序状态序列。如评价酒的味道,分成好、中、次三等,三等有次序关系,但没有数量表示。名义尺度。指标度量时既没有数量表示也没有次序关系,只有一些特性状态,如眼睛的颜色,化学中催化剂的种类等。在名义尺度中只取两种特性状态的变量是很重要的,如电路的开和关,天气的有雨和无雨,人口性别的男和女,医疗诊断中的“十”和“一”,市场交易中的买和卖等都是此类变量。五、聚类分

5、析方法系统聚类法。先将n个元素看成n类,然后将性质最接近(或相似程度最大)的两类合并为一个新类,得到n-1类。再从中找出最接近的两类加以合并,变成n-2类。如此下去,最后所有的元素全聚在一类之中。调优法。先将样品做一个初始的分类,然后按照某种最优的原则逐步调整,一直调整到分类比较合理为止。图论法。从几何观点来考虑。将n个样品看成m维空间的n个点,点与点间用直线连接,从而构成m维空间的点的连接图,再应用图论的观点将样本点在m维空间作最小支撑数,最终达到分类目的。六、tree过程画出用于描述整个聚类过程的树状图两种:根在顶

6、部根在左侧被聚类的个体称为叶包含所有个体的类称为根根叶枝七、运用SAS进行聚类分析下表列出了1999年全国31个省市和自治区的城镇居民家庭平均每人全年消费性支出的八个主要变量数据。这八个变量是:x1-x8食品、衣着、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。分别用最短距离法、重心法和离差平方和法(Ward法)作聚类分析七、运用SAS进行聚类分析最短距离法(SingleLinkage)最长距离法(CompleteMethod)中间距离法(MedianMethod)重心法(Centr

7、oidMethod)类平均法(AverageLinkage)可变类平均法(Flexible-BetaMethod)密度估计法(DensityLinkage)Mcquitty相似分析法(Mcquitty’sSimilarityAnalysis)两阶段密度估计法(Two-StageDensityLinkage)最大似然法(Elm)Ward离差平方和法(Ward’SMininum-VarianceMethod)七、运用SAS进行聚类分析七、运用SAS进行聚类分析系统聚类法具体方法提问:1)$符号含义2)horizontal七

8、、运用SAS进行聚类分析最短距离法七、运用SAS进行聚类分析重心法七、运用SAS进行聚类分析离差平方和法七、运用SAS进行聚类分析八、实例分析前言-意义前言-内容原料-试剂-方法-数据分析线性回归简要结论七、运用SAS进行聚类分析七、运用SAS进行聚类分析聚类数累积聚类结果七、运用SAS进行聚类分析八、案例赏析八、案例赏析八、案例

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。