欢迎来到天天文库
浏览记录
ID:62071006
大小:558.00 KB
页数:25页
时间:2021-04-14
《最新K均值聚类课件PPT.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。 记忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着“怎么这么热”,于是三五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到“强子,别跑了,快来我给你扇扇”。孩子们才不听这一套,跑个没完,直到累气喘吁吁,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,“你看热的,跑
2、什么?”此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲的味道! 蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲扇。 蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧道,袅K均值聚类目录K均值聚类简介K均值聚类的原理K均值算法的优缺点K均值聚类的MA
3、TLAB实现待聚类样本的分类结果结论一.K均值聚类简介K均值聚类发明于1956年,该算法最常见的形式是采用被称为劳埃德算法(Lloydalgorithm)的迭代式改进探索法。劳埃德算法首先把输入点分成K个初始化分组,可以是随机的或者使用一些启发式数据。然后计算每组的中心点,根据中心点的位置把对象分到离它最近的中心,重新确定分组。继续重复不断地计算中心并重新分组,直到收敛,即对象不再改变分组(中心点位置不再改变)。二.K均值聚类的原理2.4算法流程①给出个n混合样本,令表示迭代运算次数,选取K个初始聚心;②计算每个样本与聚合中心的距
4、离,若,则。③计算K个新的集合中心:。④判断:若,则,返回②,否则算法结束。二.K均值聚类的原理012345678910012345678910012345678910012345678910K=2将每个对象赋给最类似的中心更新簇的平均值重新赋值更新簇的平均值重新赋值算法流程示意图:三.K均值算法的优缺点优点:(1)如果变量很大,k均值比层次聚类的计算速度更快。(2)与层次聚类相比,k均值可以得到更紧密的簇,尤其是对于球状簇。(3)大数据集合,效率比较高。(4)算法尝试找出使平方误差函数最小的k个划分。当结果簇是密集的,而簇与簇之
5、间区别明显的时候,效果较好。缺点:(1)没有指明初始化均值的方法。常用的方法是随机的选取k个样本作为均值。(2)产生的结果依赖于均值的初始值,经常发生得到次优划分的情况。解决方法是多次尝试不同的初始值。(3)可能发生距离簇中心mj最近的样本集为空的情况,因此,mj将得不到更新。(4)不适合发现非凸面形状的簇,并且对噪声和离群点数据是比较敏感的,因为少量的这类数据能够对均值产生极大的影响。四.K均值聚类的MATLAB实现完整程序:clearall;data=[1702.81639.792068.741877.931860.96197
6、5.3867.812334.682535.11831.491713.111604.68460.693274.772172.992374.983346.98975.312271.893482.97946.71783.641597.992261.31198.833250.452445.081494.632072.592550.511597.031921.522126.761598.931921.081623.331243.131814.073441.07四.K均值聚类的MATLAB实现完整程序:2336.312640.261599.6
7、33543300.122373.612144.472501.62591.51426.313105.292057.81507.131556.891954.51343.073271.722036.942201.943196.22935.532232.433077.871298.871580.11752.072463.041962.41594.971835.951495.181957.443498.021125.171594.392937.7324.223447.312145.011269.071910.722701.971802.07
8、1725.811966.35四.K均值聚类的MATLAB实现完整程序:1817.361927.42328.791860.451782.881875.13];[IDX,C,SUMD,D]=kmeans(data,4);plot3(data(:,1),
此文档下载收益归作者所有