聚类分析知识

聚类分析知识

ID:44652258

大小:88.00 KB

页数:10页

时间:2019-10-24

聚类分析知识_第1页
聚类分析知识_第2页
聚类分析知识_第3页
聚类分析知识_第4页
聚类分析知识_第5页
资源描述:

《聚类分析知识》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、聚类分析法聚类分析法是理想的多变量统计技术,主要有分层聚类法和迭代聚类法。聚类分析也称群分析、点群分析,是研究分类的一种多元统计方法。例如,我们可以根据各个银行网点的储蓄量、人力资源状况、营业面积、特色功能、网点级别、所处功能区域等因素情况,将网点分为儿个等级,再比较各银行Z间不同等级网点数量对比状况。1、基本思想:我们所研究的样品(网点)或指标(变量)Z间存在程度不同的相似性(亲疏关系——以样品间距离衡量根据一批样品的多个观测指标,具体找出一•些能够度量样品或指标zi'可相似程度的以这些统计量为划分类型的依据。把一些相似程度较

2、大的样品(或指标)聚合为一类,把另外一些彼此z间相似程度较大的样品(或指标)乂聚合为另类,直到把所有的样品(或指标)暑鑿尤整墾想。在聚类分析屮,通常我们将根据分类对象的不同分为^型聚类分析:R巴炭类分(

3、两人类。R型聚类分析是对变量进行分类处理,Q型聚类分析是对样本进行分类处理。R型聚类分析的主要作用是:1、不但可以了解个别变量Z间的关系的亲疏程度,而且可以了解各个变量组合之间的亲疏程度。2、根据变量的分类结果以及它们Z间的关系,可以选样主要变量进行冋归分析或Q型聚类分析。Q型聚类分析的优点是:1、可以综合利用多个变量的信息对样

4、本进行分类;2、分类结果是直观的,聚类谱系图非常清楚地表现其数值分类结果;3、聚类分析所得到的结果比传统分类方法更细致、全而、合理。为了进行聚类分析,首先我们需要定义样品间的距离。常见的距离有:①绝对值距离②欧氏距离③明科夫斯基距离④切比雪夫距离方法聚类的儿种方法:(1)直接聚类法先把各个分类对象单独视为i类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其小一个分类对象己归于一类,则把另一个也归入该类;如果一对分类对象正好属于己归的两类,则把这两类并为i类。每一次归并,都划去该对象所在的列与列序相同的行。经过次就

5、可以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。(2)最短距离聚类法:最短距离聚类法,是在原来的mxm距离炬阵的非对介元素屮找出,把分类对象Gp和Gq归并为一新类Gr,然后按计算公式计算原来各类与新类之间的距离,这样就得到一个新的(m—1)阶的距离矩阵;再从新的距离矩阵屮选出最小者dij,把Gi和Gj归并成新类;再计算各类与新类的距离,这样一肓下去,在至各分类对象被归为一类为止。(3)最远距离聚类法最远距离聚类法为最短距离聚类法的区别在于计算原来的类为新类距离时采用的公式不同。最远距离聚类法所用的是最远距

6、离来衡量样本Z间的距离。1、概念聚类分析法属于数学与统计学的范畴。是理想的多变竝统计技术,主要有分层聚类法和迭代聚类法聚类分析法是理想的多变暈统计技术,主要有b口聚类法门迭代聚类注聚类分析也称群分析、点群分析,是研究分类的一种多元统计方法。聚类分析指将物理或抽象对象的集合分纟ft成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数于,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡用不

7、同数据源间的相似性,以及把数据源分类到不同的簇屮。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类是将数握分炎到不同的类或者簇这样的一个过程,所以同一个簇中的对彖有很大的相似性,而不同簇间的对象有很人的和异性。^统的统计聚类分析方法包括系统聚类法(也称层次聚类法)、分解法、加入法、动态聚类法、有序样品聚義k■均值、k■中心点等算法的聚类分析匸具C被加入到许多著名的统计分析软件包屮,如SPSS、SAS等。从机器学习的角度讲,簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同,无监督学习不依赖预先定义的类或带类标记的训

8、练实例,需要由聚类学习算法H动确定标记,而分类学习的实例或数据对彖有类别标记。聚类是观察式学习,而不是示例式的学习。聚类分析是一种探索性的分析,在分类的过程屮,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,口动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。从实际应用的角度看,聚类分析是数据挖掘的主耍任务z—。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。聚类分析述可以作为其他算法(

9、如分类和定性归纳算法)的预处理步骤。2、定义依据研究对象(样站或指标)的特征,对其进行分类的方法,减少研究对象的数目。各类事物缺乏可靠的历史资料,无法确定共有多少类别,目的是将性质相近事物归入—类各指标之间具有一定的相关关系。聚类分析(clusteranalys

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。