一种基于层次聚类遗传k均值算法地研究

一种基于层次聚类遗传k均值算法地研究

ID:32275767

大小:5.28 MB

页数:88页

时间:2019-02-02

一种基于层次聚类遗传k均值算法地研究_第1页
一种基于层次聚类遗传k均值算法地研究_第2页
一种基于层次聚类遗传k均值算法地研究_第3页
一种基于层次聚类遗传k均值算法地研究_第4页
一种基于层次聚类遗传k均值算法地研究_第5页
资源描述:

《一种基于层次聚类遗传k均值算法地研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、一种基于层次聚类的遗传K均值算法研究专业:信息计算科学硕士生:余庆鑫指导老师:吴红副教授摘要在信息纯高度发达的今天,麸数据海洋审提取出知识宝藏具有深远的意义。聚类律为数据挖掘的重臻方面,被广泛应用于零售业、金融业和生物科学等领域。聚类算法,更是整个聚类分析的核心。聚类算法的各方面性能,将决定整个聚类分析结果的质最,及其对现实生活的指导作用。在保持聚类算法结果稳定性和有效性的前提下,如何减轻用户负担和降低准入门槛,是一个十分有意义鹃研究谭题。本文首先对数据挖掘作了简单介绍。接着,详细介绍了数据挖掘中的聚类分析。然后,针对遗传算法的基本概念、基本流程及其研究进展等,本文也给予详

2、细介绍。目前大部分聚类算法都要求预先指定诸如聚类数目、距离阈值或密度阙值等参数,但是这些参数都楚和领域知识密切楱关的,即使是领域专家也缀难直接给出最佳的参数值,更不必说一般的用户了。为了减轻用户的负担和降低聚类分析的准入门槛,本文在深入研究相关算法的基础上,提出了凝聚遗传K均值聚类算法(AgglomerateGeneticK-MeansAlgorithm,简称AGKA)。作为本文的创新点,AGKA算法提供了一种零输入参数、多阶段、自适应确定聚类数和效果较好懿聚类算法。本文详细奔绍了AGKA算法豹总体絮槐及其流程的四个阶段,即初始化阶段、ExtendedWard阶段、最近邻凝

3、聚聚类阶段和遗传K—Means阶段,并且对其进行了细致的分析。AGKA算法有如下几个突出的优点:l。AGKA算法是一种零参数聚类算法,完全不需要焉户预先输入蓉鹰参数,大大遗减轻了耀户蕊负担,即使是没有深厚领域知识的普遵照户也可以轻松使用此算法;2.AGKA算法采用改进的Ward凝聚层次聚类算法来自动确定给定数据集的最佳聚类数目,而且还能给出不同分辨率下的最佳聚类数目,解决了目前大部分聚类算法只能得到唯一聚类数目的问题;3.AGKA结合了层次聚类算法和划分聚类算法的优点,并且综会运翅遗传算法盼全局寻绕能力释K-Means算法的局部快速撬纯麓力来对蓠蘧层次聚类阶段的结果进行精细

4、化和全局优化,从而使得最终的聚类结果其有更好的稳定性和有效性,进而提高AGKA算法的普适性。最后,本文在VisualC十+6.O平台上实现了AGKA算法,并且使用了7个人工数据集帮3个标准数据集进行实验;麸准确率、类内内聚度霹类阉摆吴度三个熊度分析实验缝采,将AGKA算法与其他算法作比较,从而在实践中检验AGKA算法的稳定性和有效性。本文末尾还对全文进行了总结,并对进一步的工作进行了展望。关键词:聚类,AGKA,GKA,ExtendedWard,K-MeansResearchIntoAGeneticK-MeansAlgorithmBasedOnHierarchicalClu

5、steringMajor:InformationandComputationalScienceName:YuQingXinSupervisor:.WuHongABSTRACTInmodemsociety,informationtechnologyishighiydeveloped,anditisofgreatimportancetodiscoverinterestingknowledgefromthevastoceanofdata.Asoneofthemostimportantcomponentsofdatamining,clusteringhasbeenwidelyuse

6、dinmanyfields,suchasretail,financialservicesandbiologicalscience.Beingtheexactcoreofclustering,clusteringalgorithmwouldgreatlyinfluencethequalityandusefulnessofclusteringresults.Ⅵ,iththestabilityandeffectivenessofclusteringresultsunchanged,itwouldbequiteameaningfulresearchsubjecttoreduceus

7、ers’burdenanddifficultyofrunningtheclusteringalgorithm.TmSthesisgivesabriefintroductiontodataminingandclustering.AndthenspecificinformationonW打dhierarchicalclusteringalgorithm,K-Meansclusteringalgorithmandgeneticalgorithmisalsoprovided.So鲺mostclusteringalgorit

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。