基于影响空间的k-means聚类算法及其应用

基于影响空间的k-means聚类算法及其应用

ID:20805163

大小:1.11 MB

页数:58页

时间:2018-10-16

基于影响空间的k-means聚类算法及其应用_第1页
基于影响空间的k-means聚类算法及其应用_第2页
基于影响空间的k-means聚类算法及其应用_第3页
基于影响空间的k-means聚类算法及其应用_第4页
基于影响空间的k-means聚类算法及其应用_第5页
资源描述:

《基于影响空间的k-means聚类算法及其应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391学校代码:10109密级:公开太原科技大学硕士学位论文(学术型)学位论文题目:基于影响空间的K-means聚类算法及其应用英文题目:TheResearchandApplicationoftheK-meansClusteringAlgorithmBasedonInfluenceSpace研究生姓名:赵文冲导师姓名及职称:蔡江辉教授培养单位:计算机科学与技术学院学科专业:计算机科学与技术论文提交日期:2016年04月10日论文答辩日期:2016年06月05日答辩委员会主席:韩燮教授论文独创性声明本人郑重声明:所呈交的论文,是本

2、人在导师指导下,独立进行研究所取得的成果。除文中特别加以标注和致谢的地方外,论文中不包含其他个人或集体已经发表或撰写的研究成果。对本研究所做的任何贡献的个人或集体均已在论文中作了明确的说明并表示了谢意。本声明产生的法律责任由本人承担。论文作者签名:日期:中文摘要中文摘要聚类分析作为一种非常重要的数据挖掘技术,已经越来越受到研究者的青睐,并被广泛应用到机器学习、模式识别、图像处理等众多领域。K-means是一种在生活、生产实践中最受关注并广泛使用的经典聚类算法,但仍然存在着对初始中心点和噪声数据敏感、聚类过程距离计算时间开销大等缺陷。本文针对

3、K-means的上述问题分别进行了研究,提出了相应的改进策略,并将改进后的聚类算法应用到天体光谱数据的分析中。主要研究内容如下:(1)针对传统K-means算法对初始中心点和噪声数据比较敏感的缺陷,给出了一种基于影响空间的K-means聚类初始中心点优化算法。该算法引入影响空间数据结构对给定数据集进行区域划分,获得各个区域中的代表数据点,并利用加权距离吸引因子对代表性数据点进行合理合并获取所需要的初始中心点。选取的初始中心点一般分布于局部密度最大区域,可以有效降低噪声数据对聚类结果的影响。理论分析与实验结果表明,该算法在聚类精度和迭代次数上

4、与同类算法比较,具有较大优势。(2)针对传统K-means算法迭代过程时间开销大的问题,给出了一种影响空间下的快速K-means(ISBFK-means)聚类算法。该算法通过对(1)中方法获取的代表数据点进行聚类,得到的代表数据点所属的类别即是该区域中所有数据点所属的类别,有效地降低迭代过程中的数据量,提高了聚类效率。利用UCI数据集与相关算法进行实验比较,实验结果验证了该算法的有效性。(3)在上述研究的基础上,采用所提出的聚类方法对LAMOST光谱数据进行了聚类分析,设计实现了基于影响空间的天体光谱聚类分析原型系统,并介绍了系统相关的功能

5、与关键技术,为分析、探究天体光谱背后隐藏的信息提供了一种有效辅助手段。关键词:K-means;影响空间;初始点优化;ISBFK-means;天体光谱IABSTRACTABSTRACTClusteringanalysis,asaveryimportantdataminingtechnology,hasbeenusedinmachinelearning,patternrecognition,imageprocessingandmanyotherfieldsbymoreandmoreresearchers.ThoughK-meansisonecl

6、assicclusteringalgorithmandevenhasbeenpopularlyandwidelyusedinthelifeandproductionpractice,therestillexistseveralshortcomings,suchassensitivitytonoisedataandinitialcenterdata,thehighclusteringtimeforthedistancecalculation,andsoon.Thispaperfirsttriestosolvetheseproblemsment

7、ionedandbringsupseriesofimprovementstrategies,thenappliestheimprovedclusteringalgorithmtothecelestialspectrumdataanalysis.Themainresearchcontentesareasfollows:(1)InviewthatthetraditionalK-meansclusteringalgorithmissensitivetoinitialcenterandnoisedata,thispapergivesaninitia

8、loptimizationalgorithmofK-meansbasedontheinfluencespace.Thealgorithmusesinfluencespace,as

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。