资源描述:
《基于密度复杂簇聚类算法研究与实现new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1622007,43(35)ComputerEngineeringandApplications计算机工程与应用基于密度复杂簇聚类算法研究与实现122宋宇辰,宋飞燕,孟海东122SONGYu-chen,SONGFei-yan,MENGHai-dong1.内蒙古科技大学经济管理学院,内蒙古包头0140102.内蒙古科技大学资源与安全工程学院,内蒙古包头0140101.SchoolofEconomicsandManagement,InnerMongoliaUniv.ofScienceandTechnology,Baotou,InnerMongolia014010,China2.SchoolofR
2、esourceandSafetyengineering,InnerMongoliaUniv.ofSci.andTechnology,Baotou,InnerMongolia014010,ChinaE-mail:songyuchen@imust.cnSONGYu-chen,SONGFei-yan,MENGHai-dong.Researchandimplementationofdensitybasedclusteringalgorithmforcomplexclusters.ComputerEngineeringandApplications,2007,43(35):162-165.Abstra
3、ct:Formodelrecognition,dataanalysis,imageprocessing,marketresearchandsoon,thekeytechniqueistohandlecom-plexlydistributedclustersefficiently.Onthebasisofanalysisandresearchoftraditionalclusteringalgorithms,aclusteringalgo-rithmbasedondensityandadaptivedensity-reachableispresentedinthispaper.Experime
4、ntalresultsshowthatthealgorithmcanhandleclustersofarbitraryshapes,sizesanddensities.Atthesametime,thisalgorithmcanevidentlyreducetimeandspacecomplexityascomparedwithotherdensity-basedalgorithms.Keywords:clusteringalgorithm;complexcluster;density-based;adaptivedensity-reachable摘要:聚类算法在模式识别、数据分析、图像处理
5、、以及市场研究的应用中,需要解决的关键技术是如何有效地聚类各种复杂的数据对象簇。在分析与研究现有聚类算法的基础上,提出了一种基于密度和自适应密度可达的改进算法。实验证明,该算法能够有效聚类任意分布形状、不同密度、不同尺度的簇;同时,算法的计算复杂度与传统基于密度的聚类算法相比有明显的降低。关键词:聚类算法;复杂簇;基于密度;自适应密度可达文章编号:1002-8331(2007)35-0162-04文献标识码:A中图分类号:TP3011和满足不同的应用要求,目前提出的主要聚类方法有[1,2]:划分引言聚类分析已经在许多领域获得了广泛的应用,包括模式识的方法、层次的方法、基于密度的方法、基于网格
6、的方法和基于别、数据分析、图像处理、市场研究。例如,在生物学上聚类分析模型的方法。能用于推导植物和动物的分类,对基因进行分类,获得对种群(1)划分的方法:对于一个给定的n个对象或元组的数据库,采用目标函数最小化的策略,通过迭代把数据分成k个划中固有结构的认识;在遥感图像解译方面能够通过聚类和关联分块,每个划分块为一个类,并且k≤n。这类方法由于需要给分析识别与理解图像;聚类也能用于对Web上的文档进行分出划分的类(簇)数目和类的初始中心点,对领域知识的依赖性类,以发现有用信息。在许多应用领域,研究对象构成的簇的分强;同时,对孤立点的存在比较敏感,对等轴状或凸型分布的对布形态是自然的、复杂形状
7、的,且在聚类前簇的数目也是未知象聚类质量较好,代表性算法有K-Means算法和K-Medoids的。面对这种现状,目前提出的基于划分的方法、基于层次的方算法。法、基于密度的方法等,无论是在聚类的有效性、精确度方面还(2)层次的方法:层次的方法对给定的数据对象集合进行是在参数的无指导方面均存在各自的问题。因此,在分析研究层次的分解,它分为凝聚和分裂的方法。凝聚的层次聚类,也称各种聚类算法的基础上,提出了基于密度