[精品]聚类分析1

[精品]聚类分析1

ID:42192057

大小:172.74 KB

页数:7页

时间:2019-09-09

[精品]聚类分析1_第1页
[精品]聚类分析1_第2页
[精品]聚类分析1_第3页
[精品]聚类分析1_第4页
[精品]聚类分析1_第5页
资源描述:

《[精品]聚类分析1》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、聚类分析聚类分析又称群分析,是根据“物以类聚”的道理,对样品或变量进行分类的一种多元统计分析方法。也就是根据样品的或变量的数据特征,把相似的样品或变量倾向于分在同一类中,把不相似的样品或变量倾向于分在不同类中。聚类分析应用于很多方面,在商业上,聚类分析被用來发现不同的客户群;在生物上,聚类分析被用来对动植物分类和对基因进行分类,获取对种群固有结构的认识;在医学中,对各种疾病进行分类分析等。聚类分析根据分类对彖的不同,可分为Q型聚类分析和/?型聚类分析。&型聚类分析是根据被观测的样木的各种特征,将特

2、征相似的样品归并一类;型聚类分析是根据被观测的变量之间的的相似性,将特征相似的变量归并一类。聚类分析根据分类方法的不同,可分为系统聚类法和动态聚类法。系统聚类分析的思想是;开始将样品或齐类变量各视为一类,根据类与类Z间的距离或相似程度将最相似的类加以合并,再计算新类与其他类之间的相似程度,并选择最相似的类加以合并,这样每合并一次就减少一类,不断连续这一过程,直到所有样品或变量合并为一类为止;动态聚类法的思想是;按照一定方法选取一批聚类中心,让样品向最近的聚心凝聚,形成初始分类,然后按照最近距离分类

3、原则不断修改不合理分类,直至g合理为止。在进行聚类分析时,样品间的相似度或变量之间的相似程度都需要一个衡量指标,我们称z为和似性的度量。一般我们用距离来度量样品z间的相似性,用相似系数来度量变量之间的相似性。距离:距离的定义有多种,在聚类分析屮常用的是欧式距离。选取〃个样品,每个样品有"个变量,则可以构成一个〃X”的数据矩阵,记宀聲2…%丿其中®•表示为第,个样品的第/个的变量,则距离%;P1妒[£(X宀)牛,k=当各变量的单位不同或测量值范围相差很大时,应先对各变量的数据作标准化处理,最常用的

4、标准化处理方法是,矿品'其中叨总g产"一1£防勺)2.相似系数:用C"•表示第,个变量与第/个变量的相似系数,其值越大,表明变量Z间的关系越密切,有时也会用其绝对值的大小來度量其相似性,且lc,7l

5、j,X2尸…%)Z间的夹角0•的余弦函数・,即C]产COS0(2)•皮尔逊相关系数:”工(

6、XQJ(XqT)r—口"一n_n_19[工(XhP)2》(X严弁k=lk=若兀内是已经标准化的,则他们间的夹角余弦就是皮尔逊相关系数。系统聚类法步骤:(1).构造〃个类,每个类只包含一个样品;(2).计算〃个类两两Z间的距离,并得岀最初的距离矩阵;(3).将距离最近的两类合并为一个新类;(4).计算新类与剩下各类两两之间的距离,若类的个数等于1,转步骤(5),否则,回到步骤(3):(5)•画聚类图:(6).决定类的个数和类。儿种常见的系统聚类方法:1•最短距离法定义类与类Z间的距离为两类最近样品

7、Z间的距离,即卩対二minPqXWG严Gq9设类q与q合并成为一个新类别Gr,则任一类q•与g「的距离是最短距离法聚类的步骤:(1).规定样品Z间的距离,计算〃个样品的距离矩阵2。),它是一个对称矩阵;(2).找!l!D(())的非对角线最小元素,设为心,贝将G昇q合并成一个新类,记为G「,即G严{G°,Gg};(3).计算新类G「与任一类$之间距离,其递推公式为D-=漲農{4%,5,展出dRmin{Dkp,D,i;}(4)•在几)中第阳行及p,q列所在的行和列通过上面的公式合并成一个新行新列,对

8、应G「,通过计算行列上的新距离值,这样就得到新的距离矩阵,记作;(5)・对久連复上述对几)的两步得到。⑵,如此下去直至所有元素合并成一类为止;(6)•如果某一步2“屮最小的元素不止一个,则称此现象为结(tie),对应这些最小元素的类可以任选一对合并或同时合并。为便于理解最短距离法德计算步骤,现例举一个简单的数字例子进行说明。设抽取五个样品,每个样品只测一个指标,他们是1,2,3.5,7.9.试用最短距离法对五个样品进行分类。(1).开始五个样品构成5类,G,={1},G2={2},G3={3.5}

9、,G4={7},G5={9};(2)定义样品间距离采用绝对距离,计算样品两两距离,得到距离矩阵2。)012.56801.5053.50(3).D(0)中最小的元素是1,即如=1,则将q和G2合并成一个新类,记为(4)•计算新类G&与其他类的距离,按距离公式得到新的距离矩阵Q⑴,75.520丿'01.50D(=(1)53.5k75.5(5).D(1)中最小的元素是1・5,即%=1・5,则将G3和G&合并成一个新类,记为G7,G?二{1.2,3.5};(6).同理得到耳2)厂0、口“

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。