资源描述:
《聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、ISSN1000-9825,CODENRUXUEWE-mail:jos@iscas.ac.cnJournalofSoftware,Vol.19,No.1,January2008,pp.48−61http://www.jos.org.cnDOI:10.3724/SP.J.1001.2008.00048Tel/Fax:+86-10-62562563©2008byJournalofSoftware.Allrightsreserved.∗聚类算法研究1,21,2+1,2孙吉贵,刘杰,赵连宇1(吉林大学计算机科学与技术学院,吉林长春130012)2(符号计算与知识工程教育部重点实验室,吉林
2、长春130012)ClusteringAlgorithmsResearch1,21,2+1,2SUNJi-Gui,LIUJie,ZHAOLian-Yu1(CollegeofComputerScienceandTechnology,JilinUniversity,Changchun130012,China)2(KeyLaboratoryofSymbolicComputationandKnowledgeEngineeringoftheMinistryofEducation,Changchun130012,China)+Correspondingauthor:Phn:+86-431-8
3、5166478,E-mail:liu_jie@jlu.edu.cnSunJG,LiuJ,ZhaoLY.Clusteringalgorithmsresearch.JournalofSoftware,2008,19(1):48−61.http://www.jos.org.cn/1000-9825/19/48.htmAbstract:Theresearchactualityandnewprogressinclusteringalgorithminrecentyearsaresummarizedinthispaper.First,theanalysisandinductionofsome
4、representativeclusteringalgorithmshavebeenmadefromseveralaspects,suchastheideasofalgorithm,keytechnology,advantageanddisadvantage.Ontheotherhand,severaltypicalclusteringalgorithmsandknowndatasetsareselected,simulationexperimentsareimplementedfrombothsidesofaccuracyandrunningefficiency,andclus
5、teringconditionofonealgorithmwithdifferentdatasetsisanalyzedbycomparingwiththesameclusteringofthedatasetunderdifferentalgorithms.Finally,theresearchhotspot,difficulty,shortageofthedataclusteringandsomependingproblemsareaddressedbytheintegrationoftheaforementionedtwoaspectsinformation.Theabove
6、workcangiveavaluablereferencefordataclusteringanddatamining.Keywords:clustering;algorithm;experiment摘要:对近年来聚类算法的研究现状与新进展进行归纳总结.一方面对近年来提出的较有代表性的聚类算法,从算法思想、关键技术和优缺点等方面进行分析概括;另一方面选择一些典型的聚类算法和一些知名的数据集,主要从正确率和运行效率两个方面进行模拟实验,并分别就同一种聚类算法、不同的数据集以及同一个数据集、不同的聚类算法的聚类情况进行对比分析.最后通过综合上述两方面信息给出聚类分析的研究热点、难点、
7、不足和有待解决的一些问题.上述工作将为聚类分析和数据挖掘等研究提供有益的参考.关键词:聚类;算法;实验中图法分类号:TP18文献标识码:A聚类分析研究有很长的历史,几十年来,其重要性及与其他研究方向的交叉特性得到人们的肯定.聚类是数∗SupportedbytheNationalNaturalScienceFoundationofChinaunderGrantNos.60473003,60573073(国家自然科学基金);theMajorResearchProgramofNatio