自适应密度峰值聚类算法的研究与应用

自适应密度峰值聚类算法的研究与应用

ID:43496126

大小:3.39 MB

页数:50页

时间:2019-10-08

自适应密度峰值聚类算法的研究与应用_第1页
自适应密度峰值聚类算法的研究与应用_第2页
自适应密度峰值聚类算法的研究与应用_第3页
自适应密度峰值聚类算法的研究与应用_第4页
自适应密度峰值聚类算法的研究与应用_第5页
资源描述:

《自适应密度峰值聚类算法的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP311单位代码:10183研究生学号:2015544054密级:公开吉林大学硕士学位论文(专业学位)自适应密度峰值聚类算法的研究与应用StudyandApplicationofAdaptiveDensitypeakClustering作者姓名:毛小梅类别:工程硕士领域(方向:软件工程指导教师:梁艳春教授培养单位:软件学院2018年6月自适应密度峰值聚类算法的研究与应用StudyandApplicationofAdaptivedensitypeakClustering作者姓名:毛小梅领

2、域(方向):软件工程指导教师:梁艳春教授类别:工程硕士答辩日期:2018年6月2日摘要自适应密度峰值聚类算法的研究与应用随着现代信息科学技术的飞速发展,数据对于各行各业的重要性众所周知,那么毋庸置疑各行各业中的数据量也在快速增长并达到了空前水平,这些海量数据来自于各行各业,例如商业界,教育行业,政府部门,科研机构,网络,甚至许多现成的在线或离线数据库,并保罗万象如文本、图像、视频、音频、动画、超链接等等。怎样从海量数据中挖掘到有用的并且能为人们所理解和利用的信息变得尤为关键。聚类技术在数据挖掘领域中有着举足轻重的地位,用于发现数据中数据对象的关系,估计数据的分

3、布。聚类是将一系列有着相似特征的数据点划分到一个类别或类簇,并且不同的簇类间相似度尽可能小。聚类是无监督的,不需要先验知识来指导怎么划分不同类别以及划分多少个类别。由于应用广泛,各种聚类算法被先后提出,不同的聚类算法有着不同的聚类策略。本文首先介绍了聚类算法常见的种类,各类算法分别适合处理什么类型的数据集类型,以及各类聚类算法的优缺点;然后是重点研究了密度峰值聚类算法,密度峰值聚类算法是基于密度的聚类算法,该算法适合处理任何形状簇类的数据集。但是密度峰值算法需要手动的选取聚类中心,而且决策图并不具有指导划分多少类的作用,我们需要在决策图上多次试验,然后选择出最

4、佳的聚类中心,所以我在密度峰值算法的基础上提出了一种新的基于密度的聚类算法,并且在多个数据集上进行了实验比对,我们对比了密度峰值聚类算法和吸引子传播聚类算法在不同数据及上的聚类效果,其中有人工合成的标准数据集,文本数据集,在图像数据集,密度峰值聚类算法在这些数据集上表现得更为优异。关键词:聚类算法,吸引子传播聚类算法密度峰值聚类算法IABSTRACTStudyandApplicationofAdaptivedensitypeakClusteringWiththerapiddevelopmentofmoderninformationscienceandtechn

5、ology,theimportanceofdatatoallwalksoflifeiswellknown,andthereisnodoubtthattheamountofdatainallwalksoflifeisgrowingrapidlyandreachinganunprecedentedlevel.Thesemassivedataarefromallwalksoflife,suchasbusiness,education,government,scientificresearchinstitutions,andnetworks.Network,oreve

6、nmanyofftheshelfonlineorofflinedatabases,andPaulVientiane,suchastext,image,video,audio,animation,hyperlinksandsoon.Howtomineusefulinformationandunderstandandmakeuseofinformationfrommassivedataisparticularlycritical.Clusteringtechnologyplaysanimportantroleindatamining.Itisusedtodisco

7、vertherelationshipbetweendataobjectsindataandestimatethedistributionofdata.Clusteringistodivideaseriesofdatapointswithsimilarcharacteristicsintoonecategoryorcluster,andthesimilaritybetweendifferentclusterclassesisassmallaspossible.Clusteringisunsupervisedanddoesnotrequirepriorknowle

8、dgetoguidedifferent

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。