改进C- 均值聚类算法.ppt

改进C- 均值聚类算法.ppt

ID:56476777

大小:248.50 KB

页数:9页

时间:2020-06-19

改进C- 均值聚类算法.ppt_第1页
改进C- 均值聚类算法.ppt_第2页
改进C- 均值聚类算法.ppt_第3页
改进C- 均值聚类算法.ppt_第4页
改进C- 均值聚类算法.ppt_第5页
资源描述:

《改进C- 均值聚类算法.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、改进C-均值聚类算法C均值算法属于聚类技术中一种基本的划分方法,具有简单、快速的优点。其基本思想是选取c个数据对象作为初始聚类中心,通过迭代把数据对象划分到不同的簇中,使簇内部对象之间的相似度很大,而簇之间对象的相似度很小。对C均值算法的初始聚类中心选择方法进行了改进,提出了一种从数据对象分布出发动态寻找并确定初始聚类中心的思路以及基于这种思路的改进算法。1、基于最小距离的初始聚类中心选取法其主要思想:(1)计算数据对象两两之间的距离;(2)找出距离最近的两个数据对象,形成一个数据对象集合A1,并将它们从总的数据集合U中删除;(3)计算A1中每

2、一个数据对象与数据对象集合U中每一个样本的距离,找出在U中与A1中最近的数据对象,将它并入集合A1并从U中删除,直到A1中的数据对象个数到达一定阈值;(4)再从U中找到样本两两间距离最近的两个数据对象构成A2,重复上面的过程,直到形成k个对象集合;(5)最后对k个对象集合分别进行算术平均,形成k个初始聚类中心。2、基于取样思想的的改进C均值算法首先对样本数据采用K-means算法进行聚类,产生一组聚类中心。然后将这组聚类中心作为初始聚类中心,在采用K-means算法进行聚类。在此,也可以在第一步中,对样本数据采用K-means算法进行n次聚类运

3、算,每次产生一组聚类中心,对n组聚类中心进行算术平均,从而得到c组初始聚类中心。算法:输入:样本集合data,C;输出:c个聚类中心;K—means(data,k)然后将输出的c个聚类中心作为初始聚类中心再用K-means得出聚类结果;3、结果ww1=Columns1through111739.91756.81803.61571.21845.61692.61680.71651.51702.81877.91831.51675.216521583.117311918.81867.51575.81713.31639.818611713.1239615

4、152163.11735.32226.521091725.11570.42068.71975.31604.71371117202126303133Columns12through201783.615971598.91507.11580.11962.41802.11817.41860.515981921.51921.11556.91752.115951725.81927.41782.92261.32126.81623.31954.5246318361966.32328.81875.1374041475152575859ww2=Columns1th

5、rough112352.12297.32092.62205.42949.22802.92063.523752271.92336.32144.525573340.13177.23243.73244.43017.13199.8334734832640.32501.61411.5535.62584.321202.7662.4219851257.2975.31946.71599.6591.51814151819222435364345Columns12through132201.92232.43196.23077.9935.531298.94950ww

6、3=864.45877.881418.81449.6867.811494.61243.11495.21125.21269.11647.32031.71775.91641.62334.72072.61814.11957.41594.41910.72665.93071.22772.93405.12535.12550.53441.134982937.72702461625323942535456ww4=Columns1through11373.3222.85401.3363.34104.8499.85172.78341.59291.02237.634

7、60.693087.13059.53259.93477.93389.83305.83084.53076.63095.73077.83274.82429.52002.321512462.92421.82196.22328.72438.62088.9225221732591012132327282934Columns12through16198.83354426.31343.0724.223250.43300.13105.33271.73447.32445.12373.62057.82036.9214538444648554、结论本文鉴于初始聚类中

8、心对C均值聚类算法的影响,以及C均值聚类算法的不足,构造了改进C均值的聚类算法。该算法通过两种方法选取初始聚类中心,然后在给定初始聚类中心的基础上再次

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。