基于密度的空间聚类算法的研究

基于密度的空间聚类算法的研究

ID:33363956

大小:1.65 MB

页数:56页

时间:2019-02-25

基于密度的空间聚类算法的研究_第1页
基于密度的空间聚类算法的研究_第2页
基于密度的空间聚类算法的研究_第3页
基于密度的空间聚类算法的研究_第4页
基于密度的空间聚类算法的研究_第5页
资源描述:

《基于密度的空间聚类算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Y

2、219528分类号TP311密级公开重庆邮电大学硕士学位论文论文题目基于密度的空间聚类算法的研究(题名和副题名)英文题目B坠塑堡塾鲤坠塑!i复二坠墅盟墨巳璺垡型ClusteringAlgorithm硕士硕究生高墨指导教师薹垂堡熬蕉论文提交日期;螋2生5且论文答辩日期20Q2生‘目3日论文评阅人一—缝t§一堑生红鱼聋生丝迸&型煎纽碰丛塾答辩委员会主席余建桥教授西南大学2007年5月30日重庆邮电人学硕士论文摘要空间数据挖掘是指从包含空问信息的数据库中抽取隐含的知识、空间关系或有意义的特征模式。它在理解空间数据、获取空间与非空间数据的内在关

3、系上具有重要意义。空间聚类分析是空间数据挖掘中一个重要的研究方向,它是按照某种相似性度量值,对空间数据集中的数据对象进行归类和标识成簇,使得同簇中的对象尽可能相似,而不同簇问的对象彼此不相似。空间聚类分析既可作为独立的空阳J数据挖掘工具,又可作为其它方法的预处理方法,目前己经应用在地理信息系统、遥感、医学图像处理、环境研究等领域,具有重要的实用价值。目前,聚类算法大体上分为划分的方法、层次的方法、基于密度的方法、基于网格的方法和基于模型的方法。这些算法存在如下的问题:符号属性问题、算法的效率问题、初值的选择问题、对输入顺序的敏感性问题、最优

4、解问题、算法对输入参数的依赖性问题。该研究对聚类算法的发展现状作了介绍,对现有的聚类算法作了深入的研究,并对其优缺点进行了比较分析。通过对一种基于密度的聚类算法DBSCAN进行分析,针对其FO开销和内存消耗大的缺陷,提出了一种基于可达核心点的聚类算法DRDBSCAN。该算法主要思想是:选择数据库中无任何标识的点进行核心点判断,围绕核心点生成源簇,再对含有共享点的源簇不断合并,从而得到最终结果。通过上述思想,该算法减少了DBSCAN算法中需要查询的点的数量,从而克服了DBSCAN算法I/O开销和内存消耗大的缺陷,提高了DBSCAN算法的聚类效

5、率。利用vC++开发工具实现该算法,并从聚类质量和效率两方面对该算法进行了测试。实验结果表明,本算法具有良好的可扩展性,可以高效地发现任意形状的聚类,不受“噪声”的影响。关键词:空间数据挖掘,聚类分析,密度重庆邮屯人学硕七论文摘要AbstractSpatialdataminingreferstopickingupconnotativeideas,rulesorsignificantmodesfromaspatialdatabase.IthasagreatsignificanceforUStounderstandspatialdataandp

6、ickuprelationsbetweenspatialdataandnon-spatialdata.Spatialclusteringisaprimaryfieldforspatialdatamining.ItisthetaskofgroupingtheobjectsofaspatialdatabaseofsomecriteriaintomeaningfulsubclassesSOthatthemembersofaclusterareassimilaraspossiblewhereasthemembersofdifferentcluste

7、rsdifferasmuchaspossiblefromeachother.Spatialclusteringcannotonlybeaspecialtechniqueofspatialdataminingbutalsothetechniqueofpretreatmentofothermeans.NowspatialclusteringhasmanyapplicationsinGIS,remotesensing,imageprocessing,andenvironmentresearchandSOon.Sofar,therearefivek

8、indsofclusteringalgorithmswhichincludepartitioned,hierarchical,densitybased,grid-based,andmodelbasedalgorithms.Unfortunately,therearemanydisadvantagesintheseclusteringalgorithms,forexample,workingonlyonnumericvalues,efficiency,sensitivetoinitialstartingconditions,sensitive

9、totheorderofdatainput,bestsolutions,relyingonparametersinpuRedandSOon.Thebackgroundofthec

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。