欢迎来到天天文库
浏览记录
ID:52483476
大小:284.42 KB
页数:4页
时间:2020-03-28
《基于近邻传播的快速搜索聚类算法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第39卷第5期华北电力大学学报Vo1.39,No.52012年9月JournalofNoahChinaElectricPowerUniversitySep.,2012基于近邻传播的快速搜索聚类算法研究苏亚然,牛习现(1.华北电力大学经济与管理学院,北京102206;2.河北科技大学经济管理学院,河北石家庄050018;3.河北青年管理干部学院信息系,河北石家庄050031)摘要:为了能够快速准确地发现自然分布的、任意形状密度变化的聚类,提出了基于近邻传播的快速扫描算法,该算法利用最近邻居关系的传递特性实现数据集合的完全聚类,简化了传统聚类方法的最近邻居
2、判定和计算,优化了搜索过程,实现了快速聚类分析过程。通过与同类算法的比对验证,结果表明该算法对目标数据集合的任意分布特性有很好的适应能力。关键词:近邻传播;自然分布;聚类分析;数据挖掘中图分类号:TP301文献标识码:A文章编号:1007—2691(2012)05—0093—04FastsearchclusteringalgorithmbasedonafinitypropagationSUYa.ran._.NIUXi.xian(1.SchoolofEconomicsandManagement,NorthChinaElectricPowerUnivers
3、ity,Beijing102206,China;2.CollegeofEconomicsandManagement,HebeiUniversityofScienceandTechnology,Shijiazhuang050018,China;3.DepartmentofInformation,HebeiYouthAdministrativeCadresCollege,Shijiazhuang050031,China)Abstract:Inordertofindallclusterswhichhavethecharacteristicsofnatural
4、distributions,arbitrarydensityandshapequicklyandaccurately,thepaperpresentanewclusteringalgorithm,thatis,theFastSearchClusteringAlgo—rithmbasedonAfinityPropagation.Utilizethetransmissioncharacteristicsamongthenearestneighbors,thealgorithmimplementthefullclusteringontargetdataset
5、.Bysimplifythecomputationandjudgeofthenearestneighborsamongthetraditionalalgorithms,andoptimizethesearchprocess,realizethefastclustering.Compareexperimentsresultwiththeotherrelatedworks;findthenewalgorithmhasthestrongadaptabilitytothenaturaldistributiondataset.Keywords:affinityp
6、ropagation;naturaldistribution;clusteringanalysis;datamining用,如矢量量化、文档归类、模式识别、知识发0引言现、语音识别、故障检测、web挖掘和数据挖掘等。聚类是按照某个特定标准(一般为距离准信息时代下社会生产活动中所产生的各类数则)把一个数据集分割成不同的类或簇,使得类据的规模急剧增加,研究人员在从海量的数据集内相似性尽可能的大,同时类问的差异性也尽可合中提取有价值的信息时遇到了前所未有的挑能的大。针对不同特征的数据集合和不同的应战⋯。数据挖掘技术的快速发展和成熟,为研究用领域,聚类分析任务
7、的侧重方向不尽相同,如人员在各种复杂类型的巨量数据集合中抽取潜在对密度形状的适应能力、噪音的检测、边界对象的、有用的、未知的知识提供了高效可行的方法的识别、聚类个数的确定、聚类结果的准确度、和手段。聚类分析作为一种最为重要的数据挖掘算法的优化速度、高维数据的聚类问题等,现在分析的方法,在一些重要领域得到了广泛的应数据分析量越来越大,数据构成越来越复杂,因此研究快速、有效的聚类算法就成为聚类研究的收稿日期:2012—04—18.重要方向之一。基金项目:河北省社会科学基金资助项目(HB12YJ064)聚类可以简单的定义为相似对象的集合,但华北电力大学学报并
8、不存在统一的相似性度量方法,目前有许多聚存在必然的关联,近邻之间的相似性或者消息是类分析算法,
此文档下载收益归作者所有