欢迎来到天天文库
浏览记录
ID:48447665
大小:783.46 KB
页数:22页
时间:2020-01-30
《K-Means聚类-基于人脸数据实现.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、数学与计算机学院课程名称:模式识别题目:K-Means聚类-基于人脸数据实现任课老师:王晓明年级专业:2011级计算机应用技术姓名:学号:时间:2011年11月12日模式识别——K-Means聚类-基于人脸数据实现目录一K-means聚类介绍........................................................................................................................2二K-means算法描述..................
2、......................................................................................................3三K-means算法matlab实现-基于人脸数据实现.........................................................................71数据读入...............................................................
3、..................................................................72算法运行结果.........................................................................................................................8四K-means算法的总结和心得............................................................
4、...........................................9五附录——核心算法的主要源代码............................................................................................10参考文献...................................................................................................................
5、........................13第1页共14页模式识别——K-Means聚类-基于人脸数据实现K-Means聚类一K-means聚类介绍1967年,J.B.MacQueen提出了K-means算法,是一种基于质心的经典聚类算法。他总结了Cox、Fisher、Sebestyen等的研究成果,给出了K-means算法的详细步骤,并用数学方法进行了证明。由于K-means算法易于描述,具有时间效率高且适于处理大规模数据等优点,自20世纪70年代以来,该算法在国内外已经被应用到包括自然语言处理、土壤、考古等众多领域。K-mea
6、ns算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。k个初始类聚类中心点的选取对聚类结果具有较大的影响,因为在该算法第一步中是随机的选取任意k个对象作为初始聚类的中心,初始地代表一个簇。该算法在每次迭代中对数据集中剩余的每个对象,根据其与各个簇中心的距离将每个对象重新赋给最近的簇。当考察完所有数据对象后,一次迭代运算完成,新的聚类中心被计算出来。如果在一次迭代前后,J的值没有发生变化,说明算法已经收敛。其算
7、法过程如下:1)从N个文档随机选取K个文档作为质心2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的类3)重新计算已经得到的各个类的质心4)迭代2~3步直至新的质心与原质心相等或小于指定阈值,算法结束该算法通常都采用均方差作标准测度函数。所产生的C个聚类有各聚类本身尽可能的紧凑而各聚类之间尽可能的分开的特点。这一算法不适合处理离散型属性,但是对于连续型具有较好的聚类效果。对于以上的说法,首先要知道K的值,也就是说C是手动设置得到,至于如何选择质心,最简单的方式无异于,随机选取质心了,然后多次运行,选取效果最好的那个结果。这
8、个方法简单但不见得有效,有很大的可能是得到局部最优。另一种复杂的方式时,随机选取一个质心,然后计算离这个质心最远的样本点,对于每个后继质心都选取以及选去过的最远点。使用这种方式,可以确保质心是
此文档下载收益归作者所有