基于变化密度的自适应空间聚类方法研究-论文.pdf

基于变化密度的自适应空间聚类方法研究-论文.pdf

ID:53761924

大小:1.03 MB

页数:7页

时间:2020-04-24

基于变化密度的自适应空间聚类方法研究-论文.pdf_第1页
基于变化密度的自适应空间聚类方法研究-论文.pdf_第2页
基于变化密度的自适应空间聚类方法研究-论文.pdf_第3页
基于变化密度的自适应空间聚类方法研究-论文.pdf_第4页
基于变化密度的自适应空间聚类方法研究-论文.pdf_第5页
资源描述:

《基于变化密度的自适应空间聚类方法研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第40卷第8期计算机工程2014年8月VO1.40NO.8ComputerEngineeringAugust2014·先进计算与数据处理·文章编号:1000-3428(2014)08-0058·06文献标识码:A中图分类号:TP181基于变化密度的自适应空间聚类方法研究杨亚军,张坤龙,杨晓科(天津大学计算机科学与技术学院,天津300072)摘要:针对DBSCAN算法无法处理变化密度的问题,提出一种基于变化密度的自适应空间聚类方法。采用密度变化率来识别不同密度的簇之间的边界,且运行时自动调整参数的值。将

2、密度定义为一个点到其第k个最近邻居的距离,若一个点的邻居的密度与该点密度的变化率小于用户给定阈值,则为相似邻居。定义核点为最邻近邻居中至少有k个是相似邻居的点,在此基础上应用DBSCAN算法进行广度优先搜索,将密度相似并且距离可达的核点及其最邻近邻居标记为同一个簇。在判断相似邻居时,根据已加入的核点的平均密度和密度变化率自动调整参数值。实验结果表明,该方法可以准确地发现任意形状、大小和密度的簇,消除孤立点,且通过自适应机制更容易设置合适参数。关键词:自适应;变化密度;k最近邻;聚类;数据挖掘Resea

3、rchonSelf-adaptiveSpatialClusteringMethodBasedonVariedDensityYANGYa-jun,ZHANGKun—long,YANGXiao—ke(SchoolofComputerScienceandTechnology,TianjinUniversity,Tianjin300072,China)【Abstract】AimingattheproblemthatDBSCANcannotfindclustersofvarieddensitiesandisse

4、nsitivetOparameters,thispaperproposesaself—adaptivespatialclusteringmethodbasedonvarieddensity.ThealgorithmusesthechangerateofdensitytOfindtheboundariesbetweenclusterswithdifferentdensities,andself_adjustthevaluesofparameters.Specifically,itdefinesonepo

5、int’SdensityasthedistancefromitselftoitskNearestNeighbor(kNN).Ifthedensitychangerateofapointandoneofitsnearestneighborsislessthanthethresholdgivenbytheuser,theneighboriscalledsimilarneighbor.Thepaperredefinescorepointaspointwhichhasatleastksimilarneighb

6、orsinitsnearestneighbors.Basedonthesemodifications,itusesDBSCANtobreadthfirstsearch,andmarkstheconnectedcorepointsaswellastheirnearestneighborsasthesamecluster.Inaddition,thealgorithmautomaticallyadjUStSthevaluesoftheparametersatruntimeaccordingtotheave

7、ragedensitiesanddensitychangerateofthemarkedcorepoints.Experimentalresultsshowthattheimprovedmethodcanfindclustersofarbitraryshape,sizeanddensity,andeliminateoutliers.Besides,withtheself—adaptive,settingparametersiseasierthanotheralgorithms.【Keywords】se

8、lf—adaption;varieddensity;kNearestNeighbor(kNN);clustering;dataminingD0I:10.3969/i.issn.1000—3428.2014.08.012较新的方法,例如核聚类、谱聚类、蚁群聚类等。其1概述中基于密度的聚类比较优秀,它可以聚类任意形状聚类是一种十分重要的数据挖掘方法。它的目和大小的簇。标是将数据对象进行分组,使得组内对象之间的相DBSCAN(DensityBasedSpati

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。