k-means聚类算法的改进

k-means聚类算法的改进

ID:35032767

大小:4.45 MB

页数:47页

时间:2019-03-16

k-means聚类算法的改进_第1页
k-means聚类算法的改进_第2页
k-means聚类算法的改进_第3页
k-means聚类算法的改进_第4页
k-means聚类算法的改进_第5页
资源描述:

《k-means聚类算法的改进》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、 ̄ ̄单位代码10602I学号2013011535分类号TP391W级公开_心'>/^序@V)吁錢j:^GUANGXINOPMALUNIVEPSITY硕击学佐4^文K-means聚类算法的改进Imrovements-meanscpofKlusteringalorithmg学院:计算机科学与信息工程学院专业:计算机应用技术研究方向:数据挖掘年级:2013级研究生:刘越指导教师:张师超教授完成日期:2016年4月K-means聚类算法的改进专业义称:计算机度用技术

2、申请人:刘越指导教师:张师超教授论文答辩委员会主席:委员:K-means聚类算法的改进年级:2013级导师:张师超教授研究生:刘越专业;计算机应用技术方向:数据挖掘摘要随着计算机信息技术的迅猛发展,人们收集的数据越来越大,我们时常都会遇到像国像、文字、视频、音频等各式各样的数据,现在大家非常关注并且迫切希望解决的问题就是:如何快速有效地从送些庞大的数据中挖掘出其有用的信息或者知识,为学科的发展做出贡献。由此,数据挖掘在这种大背景下应运而生,它提供了很多有效的方法W及可行的工具来解决人们的需求。在数据挖掘领域

3、中,聚类技术是非常重要的无监督学习方法。近些年来,人们对聚类分析技术做了重点的研究及改进,由此可见,人们对它越来越重视了。聚类技术在某些理论方面W及某些应用方面都取得了不错的成绩。现在,聚类分析技术已经在各个方面得到了广泛的应用,比如在模式识别、机器学习、文本分类、国像处理、市场营销、科学统计等领域上。常见的聚类方法有:层次方法、划分方法、网格方法、密度方法、模型方法。其中最-means聚类算法-著名的就是基于划分的k。虽然kmeans聚类算法具有简单、快速、有效等诸多优点,但还是有很多方面的不足或者说缺陷,比如说,算法初始值的选取

4、具有依赖性和敏感性,重复计算每个数据对象到聚类中也的距离,导致了运行时间的增加等。针对W上的不足,本文所做的主要工作如下:-mean1.针对ks聚类算法对巧始值的选取具有依赖性和较强的敏感性等问题,本文提一出了k-meank-me种改进的s聚类算法,主要用于解决传统ans聚类算法随机选取初始聚-类中也的问题,其核也在于改进kmeans聚类算法对于初始值的依赖关系。本文选取的巧始聚类数目为利用分合并策略来进行类别的合并,该算法的聚类数目不要求用户预先给定出来-mean,分合并后数据集类别的实验结果跟传统ks聚类算法的实验结果进行对

5、比,可W得到髙质量的聚类结果。2-m.针对keans聚类算法存在的重复计算每个数据对象到聚类中必的距离、导致运行一时间的增加等问题-means,本文分析了其中的原因,比如计算出k聚类算法在每次迭代中的每个数据对象到聚类中也的距离一,这就使得聚类效率不髙。为此,本文提出了种改一一-mean进的ks聚类算法用来解决送个问题。在每次迭代时需要个简单的数据结构来存一一次迭代时使用这些信息一储些相关的信息,在下。改进后的方法遥免了重复计算每个数据对象到聚类中也之间的距离,节省了运行的总时间。最后的实验结果得出:通过改进k-mean使得算法的运

6、行时间缩短了,提高了聚类结果的准确性,降低了s聚类算法的时间复杂度。-:kmean关键词数据挖掘:聚类算淑s算法;距离;初始中也IImrovementsof-meanscrnpKlusteigalorithmgGrade:2013Supervisor:Profe巧orZhangShichaoName:LiuYueMajor:ComputerApplicationTechnologyResiearch口irection:Dat过MiningAbstractNowadays,withthe

7、rapiddevelopmentofcomputerinfbnnation化chnology,theamountofcollecteddatagrowstreme打dously,wewillalwaysencounterimage,text,video,audioandotherkindsofdata.Nowtheroblemthatweareveryconcernedaboutandea化solveishow化pg巧uicklyandefectivelmineusefti

8、linforaiatio打ork

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。