k均值分类器-matlab

k均值分类器-matlab

ID:11858546

大小:156.37 KB

页数:9页

时间:2018-07-14

k均值分类器-matlab_第1页
k均值分类器-matlab_第2页
k均值分类器-matlab_第3页
k均值分类器-matlab_第4页
k均值分类器-matlab_第5页
资源描述:

《k均值分类器-matlab》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于K均值算法的随机数矩阵动态聚类姓名:曹刚学号:20164228030专业:信息与通信工程【摘要】聚类算法是试图识别数据集合聚类的特殊性质的学习过程。对不同均值的随机数进行基于K均值算法的动态聚类是基于准则函数最优的聚类算法,本文通过描述K均值算法的原理并通过编程仿真,对随机产生的矩阵以每一行作为坐标进行动态聚类。关键词:聚类算法,K均值算法,动态聚类;【Abstract】clusteringalgorithmisthelearningprocessattemptstoidentifytheparticularsetofdat

2、aclusteringproperties.MeandifferentrandomnumberbasedondynamicclusteringK-meansalgorithmisbasedonthecriterionfunctionoptimizedclusteringalgorithm,thepaperdescribedtheprincipleofK-meansalgorithmandsimulationbyprogramming,Therandomgenerationofthematrixtoeachlineasthecoo

3、rdinatesofthedynamicclustering.Keywords:clusteringalgorithm,K-meansalgorithm,dynamicclustering;第一章绪论1.1动态聚类法动态聚类法首先选择若干个样本作为聚类的中心,再按照事先确定的聚类准则进行聚类。在聚类的过程中,根据聚类中心进行反复修改,直到分类合理为止。其基本思想如图1所示。“动态”即指聚类过程中,聚类中心不断被修改的变化状态。动态聚类主要有两种常用算法:K-均值算法和迭代自组织的数据分析算法,本文主要介绍的是K-均值算法。图1动

4、态聚类法的基本思路1.2K均值算法K均值算法(K-meanAlgorithm,也称为C均值算法)是基于准则函数最优的聚类算法,它能够使各类样本到聚类中心的距离平方和取得极小值。已知样本集合X={x1,x2,···,xn},xj是d维特征向量,j=1,2,···,n;已知类别数K和初始聚类中心Ci;相似性测度可以采用欧氏距离;聚类准则采用误差平方和准则,其准则函数为2,Ci是第i类的聚类中心K均值算法就是通过不断调整聚类中心,是的误差平方和准则函数J取得极小值。第二章K均值算法2.1K均值算法的描述(1)初始化:给定类别数K,初始

5、化聚类中心Ci(l),(2)第l次迭代的修正:逐个将样本X={x1,x2,···,xn}按照最小距离原则分配给K个聚类中心的某一个。若,i,p=1,···,K,,则,x是聚类中心为Cp(l)的样本集。(1)计算新的聚类中心:,i=1,2,···,K其中Ni为第i个聚类所包含的样本个数。用均值向量作为新的聚类中心,可使准则函数2,i=1,2,···,K最小。在这一步要分别计算K个聚类的样本的均值向量,所谓的K均值算法就有此特点得名。(4)若,令l=l+1,转(2);将样本逐个重新分类,重复迭代计算。若,算法收敛,计算完毕。K均值算

6、法的计算复杂度是O(ndKl),其中n是样本数量,d是样本维数,K是类别数,l是迭代次数。K均值算法是以确定类别数和选定的初始聚类中心为前提,使样本到其所在类中心的距离之和最小。分类结构受到类别数和初始聚类中心的影响,得到的聚类结果是局部最优的。但是该方法简单,聚类结构可以令人满意,因而应用比较普遍。当类别数K未知时,在使用K均值算法是假设类别数逐步增加。可采用试探法,令K=2,3,4,···,对应算出准则函数J,做出J与K的关系曲线,J随K的增加而逐步减少。通常情况下,当J下降变慢时,对应的K较为合适。如果当没有明显转折点时,

7、可利用对该问题的先验知识分析选取合理的类别数。初始聚类中心的选择,有以下的几种方法:(1)凭借先验知识,将样本集大致分类,取代表点。(2)将全部样本随机地分为K类,计算每类的中心,作为初始聚类中心。(3)以每个样本为中心,某个正数r为半径,在球内落入的点的个数作为密度,取最大密度点为C1(0),然后再找出与C1(0)的距离大于r的次大密度作为新的聚类中心,依次选定。(4)选择给定样本集的前K个样本作为聚类中心。(5)从K-1类问题的出K-1个聚类中心,再找出一个最远点。第三章实验过程及结果1、根据提示输入待聚类矩阵的行列数、聚类

8、数K和聚类中心所在的行数。每一行作为一个模式样本,模式样本之间的距离定义为每一行相应位的差值平方和。现随机生成200行2列的矩阵(可以设定任意阶数的矩阵,此处是为了方便截图),相当于200个模式样本,每个样本相当于二维空间的一个坐标,在坐标中表示如下图所示,并设

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。