kmeans算法(算法+数据+代码)

kmeans算法(算法+数据+代码)

ID:40264447

大小:1.93 MB

页数:17页

时间:2019-07-29

kmeans算法(算法+数据+代码)_第1页
kmeans算法(算法+数据+代码)_第2页
kmeans算法(算法+数据+代码)_第3页
kmeans算法(算法+数据+代码)_第4页
kmeans算法(算法+数据+代码)_第5页
资源描述:

《kmeans算法(算法+数据+代码)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、K-means聚类算法聚类分析概念1K-means算法2K-means实验-国民健康3K-means实验-图像分割4K-means实验-商户评级5目录1.聚类分析概念聚类与分类的不同在于:分类简单来说,就是根据文本的特征或属性,划分到已有类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。聚类的理解更简单,就是你压根不知道数据会分为几类,通过聚类分析将数据或者说用户聚合成几个群体,那就是聚类了。聚类不需要对数据进行训练和学习。2.K-means算法Q1:K是什么?A1:k

2、是聚类算法当中类的个数。Summary:Kmeans是用均值算法把数据分成K个类的算法!Q2:means是什么?A2:means是均值算法。2.K-means算法距离的定义欧式距离:N维空间点或向量的距离曼哈顿距离:城市街区距离夹角余弦:向量方向的差异相关系数:信息熵:2.K-means算法K-means算法详解步骤一:取得k个初始中心点从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类2.K-means算法K-means算法详解MinofthreeduetotheEuclidDistance步骤二:把每个点划分进相应的簇根

3、据欧氏距离最小原则,把每个点划分进相应的簇2.K-means算法K-means算法详解MinofthreeduetotheEuclidDistance步骤三:重新计算中心点根据均值等方法,重新计算每个类的中心点2.K-means算法K-means算法详解步骤四:迭代计算中心点重复第二步和第三步2.K-means算法K-means算法详解步骤五:收敛聚类中心不再发生移动3.K-means实验-国民健康数据示意图国家和地区婴儿死亡率(‰)出生时平均预期寿命/岁1990年2000年2006年1990年2000年2006年中国36.329.920

4、.168.970.372中国香港77.480.981.6孟加拉国1006651.654.86163.7文莱108874.276.277.1柬埔寨84.57864.854.956.558.9印度806857.459.162.964.5印度尼西亚603626.461.765.868.2伊朗54363064.868.970.7以色列105.64.276.67980日本4.63.22.678.881.182.3哈萨克斯坦50.537.125.868.365.566.2朝鲜42424269.966.867韩国854.571.375.978.5老挝1

5、20775954.660.963.9马来西亚16119.870.372.674蒙古78.547.634.262.765.167.2缅甸917874.45960.161.6巴基斯坦1008577.859.16365.2菲律宾41302465.669.671.4新加坡6.72.92.374.378.179.9斯里兰卡25.616.111.271.273.675泰国25.711.77.26768.370.2越南382314.664.869.170.8埃及66.74028.962.268.871尼日利亚12010798.647.246.946.8

6、南非45505661.948.550.7加拿大6.84.977.479.280.4墨西哥41.531.629.170.97474.5美国9.46.96.575.27777.8[X,textdata]=xlsread('examp09_04.xls');row=~any(isnan(X),2);X=X(row,:);countryname=textdata(3:end,1);countryname=countryname(row);X=zscore(X);startdata=X([8,27,42],:);idx=kmeans(X,3,'St

7、art',startdata);[S,H]=silhouette(X,idx);代码轮廓图聚类结果3.K-means实验-国民健康4.K-means实验-图像分割灰度图代码分割后二值图像4.K-means实验-图像分割真彩图4.K-means实验-商户评价数据示意图代码大众点评网上1000家商户的评分4.K-means实验-商户评价聚类结果MINMAX67.4666677.96666756.3666676.945.36.33333336.8333337.43333327.9666678.46666718.4333339.333333谢谢

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。