欢迎来到天天文库
浏览记录
ID:37380253
大小:263.43 KB
页数:4页
时间:2019-05-22
《基于密度的空间聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、维普资讯http://www.cqvip.com第l8卷第8期计算机技术与发展Vo1.18NO.82008年8月COMPI.丌ERTE(HNOIS×YANDDEVEL.()PMNTAug.2008基于密度的空间聚类算法研究聂跃光,陈立潮,陈湖(太原科技大学计算机科学与技术学院,山西太原030024)摘要:基于密度的聚类算法作为数据挖掘方法中的一种主要方法,不仅可以从数据集中发现任意形状的簇,而且可以观察到一个并发的、完整的聚类结构,以及具有对噪声数据不敏感的特点。针对目前常用的几种基于密度的聚类算
2、法及改进算法进行讨论,分析了这些密度聚类算法各自的优缺点,并且以地理信息系统为应用研究背景,提出了基于密度的聚类算法与GIS相结合,通过对多维数据属性特征的提取,扩展到多维数据的处理,在三维空间地形数据中的分析中取得了高效的聚类结果。关键词:空间数据挖掘;聚类;密度聚类;GIS中图分类号:TP391文献标识码:A文章编号:1673—629X(2008)08—0091一O4ResearchofSpatialClusteringAlgorithmsBasedonDensityNIEYue—guang,
3、CHENLi—chao,CHENHu(InstituteofComputerScienceandTechnology,TaiyuanUniversityofScienceandTechnology,Tai5naan030024,China)Abstract:Spatialclusteringalgorithmbasedondensityearlfindtheclusterofrandomshape,andsomesubsequentandintegrateclusteringstructure,a
4、ndlackofsensitivitytonoiseExpoundseveraldelksitybasedspatialclusteringandsomeupswingmethod,andanalysethead—vant~eanddisadvantageofthem.Thenonbackgmundof(ISproposeamethodofcombineddensiwbasedspatialclusteringalgorithmandGIS,whichextracttheattributeofth
5、emultidimensionaldatacanexpandtohandlethemultidimensionaldata,andgetthegoodeffectfromtheanalysisofthethreedimensionspace.Keywords:spatialdatamining;clustering;densityclustering;GISO引言该类算法分为基于局部连通性(1ocalconnectivity)和基随着数据挖掘研究领域技术的发展,特别是高维于密度函数两种。前者将局部
6、范围内密度相对高的区及空间数据挖掘的兴起,作为数据挖掘主要方法之一域连通起来,形成一个簇,代表算法有D~qCAN算法、的聚类算法,也越来越受到人们的关注。数据挖掘OPTICS算法、CLIQUE算法等;后者用密度函数来模(DataMining),也称知识发现J,是从数据库中便捷地拟数据集的密度分布,代表算法有DENCLUE算法抽取出以前未知的、隐含的、有用的信息,所挖掘出来等。的知识可应用于信息管理、决策支持、过程控制和其它许多应用。所谓聚类,就是把大量的d维数据样本(”1几种用于空间数据挖掘的密度
7、聚类算法个)聚集成k个类(k,7"/),使同一类中样本的相似性最1.1DBSCAN算法大,而不同类中样本的相似性最小。DBSCAN(DensityBasedSpatialClusteringofAppli—基于密度的聚类算法将簇看作是数据空间中被较cationswithNoise)算法l'J,是一种比较有代表性的基低密度的区域分割开的高密度对象区域,因此可以发于密度的空间聚类算法,它将簇定义为密度相连的点现任意形状的簇,并能识别噪声数据。根据实现方法,的最大集合,能够把具有足够高密度的区域划分为簇
8、,并可在有“噪声”的空间数据库中发现任意形状的聚收稿日期:2007一ll一26类。基金项目:山西省自然科学基金(200501044)I)P~C_-CAN的算法思想是:从数据集D中的任意一作者简介:聂跃光(1982~),男,山西忻州人,硕士研究生,研究方向为人工智能;陈立潮,教授,博:士,研究方向为模式识别、人=【‘智能、个点P开始,查找D中所有关于Eps(最小半径)和数据挖掘。MinPt,~(密度阈值)的从P密度可达的点。若P是核心维普资讯http://www.cqvip.com·
此文档下载收益归作者所有