欢迎来到天天文库
浏览记录
ID:43524549
大小:1.80 MB
页数:39页
时间:2019-10-09
《基于数据几何特征的空间聚类算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、重庆师范大学硕士学位论文基于数据几何特征的空间聚类算法硕士研究生:李婧指导教师:王洪春教授学科专业:应用数学所在学院:数学学院重庆师范大学二〇一四年六月万方数据AThesisSubmittedtoChongqingNormalUniversityinPartialFulfillmentoftheRequirementsfortheDegreeofMasterSpatialClusteringalgorithmbasedonGeometricFeaturesofdataCandidate:LiJingSupervisor:WangHongchunProfessorMajor:AppliedMat
2、hematicsCollege:CollegeofMathematicsChongqingNormalUniversityJune,2014万方数据重庆师范大学硕士学位论文中文摘要基于数据几何特征的空间聚类算法摘要聚类分析是数据分析中的一个重要技术,它的应用极为广泛。许多邻域中都会涉及聚类分析方法的应用与研究工作。例如,在科学数据探测、信息检索、文本挖掘、生物学、医学诊断等方面的数据挖掘应用软件中,聚类分析技术都起着重要的作用。此外,聚类分析作为数据挖掘中的一个重要部分,可以作为数据挖掘中其它分析算法的一个预处理步骤,本文为聚类分析算法进行了分析和研究,提出了一些改进的算法。所谓聚类,就是将数
3、据对象集合划分为由类似的数据对象组成的多个类的过程。聚类的基本原则就是使同一类的数据对象尽可能的相似,不同类中的数据对象相似性较小。而在聚类中,一般用数据对象之间的距离来表示数据之间的相似性。聚类已经被广泛的研究了许多年,迄今为止,已经出现了大量经典的聚类算法。大体上,这些聚类算法可以分为基于划分的聚类算法,基于层次的聚类算法,基于密度的聚类算法,基于网格的聚类算法,基于模型的聚类算法。所有的这些算法都通过不同的途径实现了对数据集的有效聚类。但快速、精确而简便的聚类算法仍然是一个有待研究的开放性问题。鉴于此,论文的第三章节,在层次算法思想和数据对象的几何特点的基础上提出来提出了一种新的聚类算法
4、,基于概率的快速聚类算法。K-均值算法作为经典的聚类算法之一,具有实现简单、理论可靠等特点。但K-均值聚类算法的结果仍然容易受到多种因素的影响,比如所选的初始聚类中心的位置。因此,在论文的第四章节,针对初始聚类中心对聚类效果的影响,把最大最小距离算法中预选初始聚类中心的基本思想和聚类的基本原则结合,对初始聚类中心的选取提出了改进。这样使得初始聚类中心能够更好的反应模式样本集的几何特征,以便在聚类时能够减少迭代次数、提高聚类准确度。本文通过对UCI数据库中的Iris数据集和Wine数据集进行了实验,验证了本文提出的算法的有效性,并且有较好的聚类效果。关键词:聚类分析,层次聚类算法,密度参数,k-
5、均值算法I万方数据重庆师范大学硕士学位论文英文摘要SpatialClusteringalgorithmbasedonGeometricFeaturesofdataABSTRACTClusteringanalysisisanimportanttechnologyindataanalysisanditsapplicationisveryextensive.Manyfieldwillinvolvetheapplicationofclusteringanalysismethodandresearchwork.Forexample,inscientificdatadetecting,informatio
6、nretrieval,textmining,biology,medicaldiagnosisapplicationofdatamining,clusteringanalysistechnologyplaysanimportantroleintheseapplication.Inaddition,theclusteranalysisasanimportantpartofdatamining,itcanbeasapreprocessingstepoftheotheranalysisalgorithmindatamining,thisarticleasaclusteringanalysisalgor
7、ithmfortheanalysisandresearch,atthesametime,itputforwardsomeimprovedalgorithm.Theso-calledclustering,isdividedthedatacollectionofobjectsofsimilardataobjectprocessofmultipleclasses.Thebasicprinciplesof
此文档下载收益归作者所有