k均值分类器-matlab

ID：11858546

大小：156.37 KB

页数：9页

时间：2018-07-14

资源描述：

《k均值分类器-matlab》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、基于K均值算法的随机数矩阵动态聚类姓名：曹刚学号：20164228030专业：信息与通信工程【摘要】聚类算法是试图识别数据集合聚类的特殊性质的学习过程。对不同均值的随机数进行基于K均值算法的动态聚类是基于准则函数最优的聚类算法，本文通过描述K均值算法的原理并通过编程仿真，对随机产生的矩阵以每一行作为坐标进行动态聚类。关键词：聚类算法，K均值算法，动态聚类；【Abstract】clusteringalgorithmisthelearningprocessattemptstoidentifytheparticularsetofdat

2、aclusteringproperties.MeandifferentrandomnumberbasedondynamicclusteringK-meansalgorithmisbasedonthecriterionfunctionoptimizedclusteringalgorithm,thepaperdescribedtheprincipleofK-meansalgorithmandsimulationbyprogramming,Therandomgenerationofthematrixtoeachlineasthecoo

3、rdinatesofthedynamicclustering.Keywords:clusteringalgorithm,K-meansalgorithm,dynamicclustering;第一章绪论1.1动态聚类法动态聚类法首先选择若干个样本作为聚类的中心，再按照事先确定的聚类准则进行聚类。在聚类的过程中，根据聚类中心进行反复修改，直到分类合理为止。其基本思想如图1所示。“动态”即指聚类过程中，聚类中心不断被修改的变化状态。动态聚类主要有两种常用算法：K-均值算法和迭代自组织的数据分析算法，本文主要介绍的是K-均值算法。图1动

4、态聚类法的基本思路1.2K均值算法K均值算法（K-meanAlgorithm,也称为C均值算法）是基于准则函数最优的聚类算法，它能够使各类样本到聚类中心的距离平方和取得极小值。已知样本集合X={x1，x2，···，xn}，xj是d维特征向量，j=1,2,···，n；已知类别数K和初始聚类中心Ci；相似性测度可以采用欧氏距离；聚类准则采用误差平方和准则，其准则函数为2，Ci是第i类的聚类中心K均值算法就是通过不断调整聚类中心，是的误差平方和准则函数J取得极小值。第二章K均值算法2.1K均值算法的描述（1）初始化：给定类别数K，初始

5、化聚类中心Ci（l），（2）第l次迭代的修正：逐个将样本X={x1，x2，···，xn}按照最小距离原则分配给K个聚类中心的某一个。若，i，p=1，···，K，，则，x是聚类中心为Cp（l）的样本集。（1）计算新的聚类中心：，i=1,2，···，K其中Ni为第i个聚类所包含的样本个数。用均值向量作为新的聚类中心，可使准则函数2，i=1,2，···，K最小。在这一步要分别计算K个聚类的样本的均值向量，所谓的K均值算法就有此特点得名。（4）若，令l=l+1，转（2）；将样本逐个重新分类，重复迭代计算。若，算法收敛，计算完毕。K均值算

6、法的计算复杂度是O（ndKl），其中n是样本数量，d是样本维数，K是类别数，l是迭代次数。K均值算法是以确定类别数和选定的初始聚类中心为前提，使样本到其所在类中心的距离之和最小。分类结构受到类别数和初始聚类中心的影响，得到的聚类结果是局部最优的。但是该方法简单，聚类结构可以令人满意，因而应用比较普遍。当类别数K未知时，在使用K均值算法是假设类别数逐步增加。可采用试探法，令K=2,3,4，···，对应算出准则函数J，做出J与K的关系曲线，J随K的增加而逐步减少。通常情况下，当J下降变慢时，对应的K较为合适。如果当没有明显转折点时，

7、可利用对该问题的先验知识分析选取合理的类别数。初始聚类中心的选择，有以下的几种方法：（1）凭借先验知识，将样本集大致分类，取代表点。（2）将全部样本随机地分为K类，计算每类的中心，作为初始聚类中心。（3）以每个样本为中心，某个正数r为半径，在球内落入的点的个数作为密度，取最大密度点为C1（0），然后再找出与C1（0）的距离大于r的次大密度作为新的聚类中心，依次选定。（4）选择给定样本集的前K个样本作为聚类中心。（5）从K-1类问题的出K-1个聚类中心，再找出一个最远点。第三章实验过程及结果1、根据提示输入待聚类矩阵的行列数、聚类

8、数K和聚类中心所在的行数。每一行作为一个模式样本，模式样本之间的距离定义为每一行相应位的差值平方和。现随机生成200行2列的矩阵(可以设定任意阶数的矩阵，此处是为了方便截图)，相当于200个模式样本，每个样本相当于二维空间的一个坐标，在坐标中表示如下图所示，并设

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 9



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

k均值分类器-matlab

k均值分类器-matlab

相关文章

相关标签