欢迎来到天天文库
浏览记录
ID:58149803
大小:1.02 MB
页数:12页
时间:2020-04-25
《全粒度聚类算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、南京大学学报(自然科学)第50卷第4期Vo1.50,No.4JOURNALOFNANJINGUNIVERSITY2014年7月July,2014(NATURALSCIENCES)全粒度聚类算法李飞江卜,成红红,钱宇华(1.山西大学计算机与信息技术学院,太原,030006;2.山西大学数学科学学院,太原,030006)摘要:聚类分析是数据挖掘与知识发现领域的一个重要研究方向.多数聚类算法中相似性是其核心概念之一,对象之间的相似性会被直接或者间接的计算出来.传统的相似性度量方法多是基于单一的粒度去观察两个被测对象.在
2、人类认知过程中,通常采用多粒度来更合理有效地进行问题求解.本文借鉴人类的这种多粒度认知机理,提出一种新的相似性学习方法,称作全粒度相似性度量方法,基于此发展了一种全粒度聚类算法.而全粒度相似性度量从各个角度观察被测对象,进而会得到两个对象间更加真实的相似度.从UCI数据集中选取5组数据进行实验,最后通过与两种传统的聚类方法比较验证了全粒度聚类算法的合理性与有效性.关键词:相似性度量,聚类分析,全粒度Whole—granulationclusteralgorithmLiFeijiang,ChengHonghong,
3、QianYuhua(1.SchoolofComputerandInformationTechnology,ShanxiUniversity,Taiyuan,03006,China;2.SchoolofMathematics,ShanxiUniversity,Taiyuan,03006,China)Abstract:Inclusteranalysis,especiallyclusterinanoptimizationprocess,oneofthedecisivefactorsisthesimilaritymeas
4、ureemployedintheclusteringcriterionfunction.Byfar,allproposedclustermethodshavetoassumeconnectionamongtheinformationobjectsthatappliedon.Similaritybetweeneverypairobjectsshouldbecomputed,therearetwochoiceswhichdefinedasexplicitlyorimplicitly.Henceweatherthest
5、ructureofdatacanbedescribedbythesimilaritymeasurecorrectlydeterminestheeffectivenessofaclusteringalgorithm.Inaddition,asoneofimportantcharactersinhuman'scognition,multi—granulationcognitionplaysakeyrolefordatamodeling.Onaccountoffrommulti—perspectiveandmulti—
6、leveltoparseoneproblem,multgranulationanalysiscanobtainmorereasonableandmoresatisfiedsolutions.Throughreferencinghumansmulti—granulationcognitiveability,inthispaper,weintroducedanovelsimilaritymeasurecalledwhole—granulationsimilaritymeasureandapplythissimilar
7、itymeasureintoclusteringcriterionfunctiontogetaclusteralgorithmcalledwhole—granulationclusteralgorithminordertoverifytherationalizationofwhole_granulati0nsimilaritymeasure.Thetraditionaldissimilarity/similaritymeasureexerciseonlyonesingleviewpoints,usuallyist
8、heorigin.Moreinformativeassessmentofsimilaritycouldbeachievedbecausewholegranulationtakesallsidesintoconsideration.Asaleadingpartitionalclusteringtechnique,kmcansisoneofthemostfavoritealg
此文档下载收益归作者所有