欢迎来到天天文库
浏览记录
ID:53761924
大小:1.03 MB
页数:7页
时间:2020-04-24
《基于变化密度的自适应空间聚类方法研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第40卷第8期计算机工程2014年8月VO1.40NO.8ComputerEngineeringAugust2014·先进计算与数据处理·文章编号:1000-3428(2014)08-0058·06文献标识码:A中图分类号:TP181基于变化密度的自适应空间聚类方法研究杨亚军,张坤龙,杨晓科(天津大学计算机科学与技术学院,天津300072)摘要:针对DBSCAN算法无法处理变化密度的问题,提出一种基于变化密度的自适应空间聚类方法。采用密度变化率来识别不同密度的簇之间的边界,且运行时自动调整参数的值。将
2、密度定义为一个点到其第k个最近邻居的距离,若一个点的邻居的密度与该点密度的变化率小于用户给定阈值,则为相似邻居。定义核点为最邻近邻居中至少有k个是相似邻居的点,在此基础上应用DBSCAN算法进行广度优先搜索,将密度相似并且距离可达的核点及其最邻近邻居标记为同一个簇。在判断相似邻居时,根据已加入的核点的平均密度和密度变化率自动调整参数值。实验结果表明,该方法可以准确地发现任意形状、大小和密度的簇,消除孤立点,且通过自适应机制更容易设置合适参数。关键词:自适应;变化密度;k最近邻;聚类;数据挖掘Resea
3、rchonSelf-adaptiveSpatialClusteringMethodBasedonVariedDensityYANGYa-jun,ZHANGKun—long,YANGXiao—ke(SchoolofComputerScienceandTechnology,TianjinUniversity,Tianjin300072,China)【Abstract】AimingattheproblemthatDBSCANcannotfindclustersofvarieddensitiesandisse
4、nsitivetOparameters,thispaperproposesaself—adaptivespatialclusteringmethodbasedonvarieddensity.ThealgorithmusesthechangerateofdensitytOfindtheboundariesbetweenclusterswithdifferentdensities,andself_adjustthevaluesofparameters.Specifically,itdefinesonepo
5、int’SdensityasthedistancefromitselftoitskNearestNeighbor(kNN).Ifthedensitychangerateofapointandoneofitsnearestneighborsislessthanthethresholdgivenbytheuser,theneighboriscalledsimilarneighbor.Thepaperredefinescorepointaspointwhichhasatleastksimilarneighb
6、orsinitsnearestneighbors.Basedonthesemodifications,itusesDBSCANtobreadthfirstsearch,andmarkstheconnectedcorepointsaswellastheirnearestneighborsasthesamecluster.Inaddition,thealgorithmautomaticallyadjUStSthevaluesoftheparametersatruntimeaccordingtotheave
7、ragedensitiesanddensitychangerateofthemarkedcorepoints.Experimentalresultsshowthattheimprovedmethodcanfindclustersofarbitraryshape,sizeanddensity,andeliminateoutliers.Besides,withtheself—adaptive,settingparametersiseasierthanotheralgorithms.【Keywords】se
8、lf—adaption;varieddensity;kNearestNeighbor(kNN);clustering;dataminingD0I:10.3969/i.issn.1000—3428.2014.08.012较新的方法,例如核聚类、谱聚类、蚁群聚类等。其1概述中基于密度的聚类比较优秀,它可以聚类任意形状聚类是一种十分重要的数据挖掘方法。它的目和大小的簇。标是将数据对象进行分组,使得组内对象之间的相DBSCAN(DensityBasedSpati
此文档下载收益归作者所有