欢迎来到天天文库
浏览记录
ID:43496126
大小:3.39 MB
页数:50页
时间:2019-10-08
《自适应密度峰值聚类算法的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP311单位代码:10183研究生学号:2015544054密级:公开吉林大学硕士学位论文(专业学位)自适应密度峰值聚类算法的研究与应用StudyandApplicationofAdaptiveDensitypeakClustering作者姓名:毛小梅类别:工程硕士领域(方向:软件工程指导教师:梁艳春教授培养单位:软件学院2018年6月自适应密度峰值聚类算法的研究与应用StudyandApplicationofAdaptivedensitypeakClustering作者姓名:毛小梅领
2、域(方向):软件工程指导教师:梁艳春教授类别:工程硕士答辩日期:2018年6月2日摘要自适应密度峰值聚类算法的研究与应用随着现代信息科学技术的飞速发展,数据对于各行各业的重要性众所周知,那么毋庸置疑各行各业中的数据量也在快速增长并达到了空前水平,这些海量数据来自于各行各业,例如商业界,教育行业,政府部门,科研机构,网络,甚至许多现成的在线或离线数据库,并保罗万象如文本、图像、视频、音频、动画、超链接等等。怎样从海量数据中挖掘到有用的并且能为人们所理解和利用的信息变得尤为关键。聚类技术在数据挖掘领域中有着举足轻重的地位,用于发现数据中数据对象的关系,估计数据的分
3、布。聚类是将一系列有着相似特征的数据点划分到一个类别或类簇,并且不同的簇类间相似度尽可能小。聚类是无监督的,不需要先验知识来指导怎么划分不同类别以及划分多少个类别。由于应用广泛,各种聚类算法被先后提出,不同的聚类算法有着不同的聚类策略。本文首先介绍了聚类算法常见的种类,各类算法分别适合处理什么类型的数据集类型,以及各类聚类算法的优缺点;然后是重点研究了密度峰值聚类算法,密度峰值聚类算法是基于密度的聚类算法,该算法适合处理任何形状簇类的数据集。但是密度峰值算法需要手动的选取聚类中心,而且决策图并不具有指导划分多少类的作用,我们需要在决策图上多次试验,然后选择出最
4、佳的聚类中心,所以我在密度峰值算法的基础上提出了一种新的基于密度的聚类算法,并且在多个数据集上进行了实验比对,我们对比了密度峰值聚类算法和吸引子传播聚类算法在不同数据及上的聚类效果,其中有人工合成的标准数据集,文本数据集,在图像数据集,密度峰值聚类算法在这些数据集上表现得更为优异。关键词:聚类算法,吸引子传播聚类算法密度峰值聚类算法IABSTRACTStudyandApplicationofAdaptivedensitypeakClusteringWiththerapiddevelopmentofmoderninformationscienceandtechn
5、ology,theimportanceofdatatoallwalksoflifeiswellknown,andthereisnodoubtthattheamountofdatainallwalksoflifeisgrowingrapidlyandreachinganunprecedentedlevel.Thesemassivedataarefromallwalksoflife,suchasbusiness,education,government,scientificresearchinstitutions,andnetworks.Network,oreve
6、nmanyofftheshelfonlineorofflinedatabases,andPaulVientiane,suchastext,image,video,audio,animation,hyperlinksandsoon.Howtomineusefulinformationandunderstandandmakeuseofinformationfrommassivedataisparticularlycritical.Clusteringtechnologyplaysanimportantroleindatamining.Itisusedtodisco
7、vertherelationshipbetweendataobjectsindataandestimatethedistributionofdata.Clusteringistodivideaseriesofdatapointswithsimilarcharacteristicsintoonecategoryorcluster,andthesimilaritybetweendifferentclusterclassesisassmallaspossible.Clusteringisunsupervisedanddoesnotrequirepriorknowle
8、dgetoguidedifferent
此文档下载收益归作者所有