数据挖掘中增量聚类算法的研究

数据挖掘中增量聚类算法的研究

ID:35182872

大小:2.85 MB

页数:55页

时间:2019-03-21

数据挖掘中增量聚类算法的研究_第1页
数据挖掘中增量聚类算法的研究_第2页
数据挖掘中增量聚类算法的研究_第3页
数据挖掘中增量聚类算法的研究_第4页
数据挖掘中增量聚类算法的研究_第5页
资源描述:

《数据挖掘中增量聚类算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工程硕士学位论文数据挖掘中增量聚类算法的研究张义哈尔滨理工大学2016年3月国内图书分类号:TP391.1工程硕士学位论文数据挖掘中增量聚类算法的研究硕士研究生:张义导师:万静申请学位级别:工程硕士学科、专业:计算机技术所在单位:计算机科学与技术学院答辩日期:2016年3月授予学位单位:哈尔滨理工大学ClassifiedIndex:TP391.1DissertationfortheMasterDegreeinEngineeringResearchonincrementalclusteringalgorithmindataminingCandidate:ZhangYiSupervi

2、sor:WanJingAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerTechnologyDateofOralExamination:March,2016University:HarbinUniversityofScienceandTechnology哈尔滨理工大学硕±学位论文原创性声明本人郑重声明;此处所提交的硕±学位论文《数据挖掘中增量聚类算法研究》,是本人在导师指导下,在哈尔滨理工大学攻读硕±学位期间独立进行研究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写

3、过的研究成果。对本文研究工作做出贡献的个人和集体,均己在文中W明确方式注明。本声明的法律结果将完全由本人承担。作者签名日期年>月L日^哈尔滨理工大学硕±学位论文使用授权书《数据挖掘中增量聚类算法研究》系本人在哈尔滨理工大学攻读硕±学位期间在导师指导下完成的硕±学位论文。本论文的研究成果归哈尔滨理工大学所有,本论文的研究内容不得W其他单位的名义发表。本人完全了解哈尔滨理工大学关于保存、使用学位论文的规定,同意学校保留并向有关部口提交论文和电子版本,允许论文被查阅和借阅。本人授权哈尔滨理工大学可W采用影印、缩印或其他复制手段保存论文,可W公布论文

4、的全部或部分内容。本学位论文属于。保密,在年解密后适用授权书I□不保密0。(请在W上相应方框内打V)作者签名:旅义円期:年月円导师签名:円期:年方月^円哈尔滨理工大学工程硕士学位论文数据挖掘中增量聚类算法的研究摘要数据挖掘技术领域中一项重要的数据分析技术——聚类分析技术在许多重要方面都得到了广泛的应用,近年来得到了广泛的研究,并取得了较快的发展。其实,聚类问题实质上是把待处理的原始样本数据对象通过某种相似性准则函数被分为若干类,想要达到的结果就是同一组相似性尽可能高,不同组之间差异性尽可能大,然后在这些不同组之间寻找联系,进行进一步的操作。目前

5、研究的聚类分析大致可以分为:划分聚类(Partitioningclustering)、层次聚类(Hierarchicalclustering)、网格聚类(Grid-basedclustering)、密度聚类(Densityclustering)、模糊聚类(FuzzyClusteringAlgorithm)、模型聚类(Modelclustering)等。聚类K-means方法是一种基于分割的聚类算法,由于其易于实现,易于操作,简单高效,被广大研究学者广泛用于研究。但也有一些缺陷,K-means方法在选取初始中心进行聚类时采取的是随机选取的形式,这就使得聚类结果将遵循初始中心选择变化

6、,因此,本文在K-means方法的基础之上,针对K-means方法存在的不足之处进行了钻研与应用,主要的钻研有以下几个方面:1.对于传统的K-means方法进行了探讨,针对传统K-means聚类算法初始聚类中心随机选取的缺陷进行改进,本文根据KD-树这种高效的数据结构对K-means方法进行改进提出了优化中心选取的新方法。该方法引入KD-树这种数据结构,将数据集建立KD-树,通过对KD-树中矩形单元的分割、计算、排序等操作,选取出能够表示样本数据分布形态的k个非噪声点的初始聚类中心;根据上述提出的算法,结合优化选取的k个代表样本数据空间分布形态的初始聚类中心和增量数据建立新的KD

7、-树,通过近邻搜索将增量数据划分到对应的类中,完成增量数据的动态聚类过程。2.传统协同过滤算法应用的样本数据空间都会转化为用户-项目评分矩阵,但是矩阵中会出现“0”值或是空值,使得转化后的评分矩阵数据稀疏,本文中提出的算法机制是结合了聚类分析的技术和协同过滤的技术同时产生商品推荐。其中主要是在聚类分析算法中选择了K-means方法进行了研究与使用,K-means方法存在一个最典型的缺陷就是聚类初始阶段随机选取中心-I-哈尔滨理工大学工程硕士学位论文点,本文的新方法先是利用Krus

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。