欢迎来到天天文库
浏览记录
ID:32275767
大小:5.28 MB
页数:88页
时间:2019-02-02
《一种基于层次聚类遗传k均值算法地研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、一种基于层次聚类的遗传K均值算法研究专业:信息计算科学硕士生:余庆鑫指导老师:吴红副教授摘要在信息纯高度发达的今天,麸数据海洋审提取出知识宝藏具有深远的意义。聚类律为数据挖掘的重臻方面,被广泛应用于零售业、金融业和生物科学等领域。聚类算法,更是整个聚类分析的核心。聚类算法的各方面性能,将决定整个聚类分析结果的质最,及其对现实生活的指导作用。在保持聚类算法结果稳定性和有效性的前提下,如何减轻用户负担和降低准入门槛,是一个十分有意义鹃研究谭题。本文首先对数据挖掘作了简单介绍。接着,详细介绍了数据挖掘中的聚类分析。然后,针对遗传算法的基本概念、基本流程及其研究进展等,本文也给予详
2、细介绍。目前大部分聚类算法都要求预先指定诸如聚类数目、距离阈值或密度阙值等参数,但是这些参数都楚和领域知识密切楱关的,即使是领域专家也缀难直接给出最佳的参数值,更不必说一般的用户了。为了减轻用户的负担和降低聚类分析的准入门槛,本文在深入研究相关算法的基础上,提出了凝聚遗传K均值聚类算法(AgglomerateGeneticK-MeansAlgorithm,简称AGKA)。作为本文的创新点,AGKA算法提供了一种零输入参数、多阶段、自适应确定聚类数和效果较好懿聚类算法。本文详细奔绍了AGKA算法豹总体絮槐及其流程的四个阶段,即初始化阶段、ExtendedWard阶段、最近邻凝
3、聚聚类阶段和遗传K—Means阶段,并且对其进行了细致的分析。AGKA算法有如下几个突出的优点:l。AGKA算法是一种零参数聚类算法,完全不需要焉户预先输入蓉鹰参数,大大遗减轻了耀户蕊负担,即使是没有深厚领域知识的普遵照户也可以轻松使用此算法;2.AGKA算法采用改进的Ward凝聚层次聚类算法来自动确定给定数据集的最佳聚类数目,而且还能给出不同分辨率下的最佳聚类数目,解决了目前大部分聚类算法只能得到唯一聚类数目的问题;3.AGKA结合了层次聚类算法和划分聚类算法的优点,并且综会运翅遗传算法盼全局寻绕能力释K-Means算法的局部快速撬纯麓力来对蓠蘧层次聚类阶段的结果进行精细
4、化和全局优化,从而使得最终的聚类结果其有更好的稳定性和有效性,进而提高AGKA算法的普适性。最后,本文在VisualC十+6.O平台上实现了AGKA算法,并且使用了7个人工数据集帮3个标准数据集进行实验;麸准确率、类内内聚度霹类阉摆吴度三个熊度分析实验缝采,将AGKA算法与其他算法作比较,从而在实践中检验AGKA算法的稳定性和有效性。本文末尾还对全文进行了总结,并对进一步的工作进行了展望。关键词:聚类,AGKA,GKA,ExtendedWard,K-MeansResearchIntoAGeneticK-MeansAlgorithmBasedOnHierarchicalClu
5、steringMajor:InformationandComputationalScienceName:YuQingXinSupervisor:.WuHongABSTRACTInmodemsociety,informationtechnologyishighiydeveloped,anditisofgreatimportancetodiscoverinterestingknowledgefromthevastoceanofdata.Asoneofthemostimportantcomponentsofdatamining,clusteringhasbeenwidelyuse
6、dinmanyfields,suchasretail,financialservicesandbiologicalscience.Beingtheexactcoreofclustering,clusteringalgorithmwouldgreatlyinfluencethequalityandusefulnessofclusteringresults.Ⅵ,iththestabilityandeffectivenessofclusteringresultsunchanged,itwouldbequiteameaningfulresearchsubjecttoreduceus
7、ers’burdenanddifficultyofrunningtheclusteringalgorithm.TmSthesisgivesabriefintroductiontodataminingandclustering.AndthenspecificinformationonW打dhierarchicalclusteringalgorithm,K-Meansclusteringalgorithmandgeneticalgorithmisalsoprovided.So鲺mostclusteringalgorit
此文档下载收益归作者所有