欢迎来到天天文库
浏览记录
ID:32988183
大小:4.05 MB
页数:50页
时间:2019-02-18
《基于多层核心集的凝聚聚类算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中图分类号:TP391论文编号:102870813-S023学科分类号:070104硕士学位论文基于多层核心集的凝聚聚类算法研究生姓名王秀丽专业名称应用数学研究方向聚类算法方向指导教师马儒宁副教授南京航空航天大学研究生院理学院二О一二年十二月NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofScienceMultilevelCore-setsbasedAggregationClusteringAlgorithmAThes
2、isinMathematicsbyWangXiuliAdvisedbyProf.MaRuningSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofScienceDecember,2012承诺书本人声明所呈交的硕士学位论文是本人在导师指导下进行的研究工作及取得的研究成果.除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京航空航天大学或其他教育机构的学位或证书而使用过的材料.本人授
3、权南京航空航天大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文.(保密的学位论文在解密后适用本承诺书)作者签名:日期:南京航空航天大学硕士学位论文摘要聚类分析是无监督模式分类的一个重要组成部分,也成为现代数据分析中越来越重要的一个工具。初始条件、相似性准则和聚类准则的不同产生的聚类算法也不尽相同。因此,聚类算法是一个内容庞杂的大家族。至今,众研究学者也提出了多种多样的聚类算法。许多经典的聚类算法,如平均链接、K-means、K-medoids、Cla
4、ra、Clarans等,都是利用单一的聚类中心进行聚类。为克服单一聚类中心只能描述凸状聚类的缺陷,CURE、DBSCAN等算法使用多个代表点(或稠密点)表述任意形状的聚类结构,但仍难以聚类重叠和噪声数据。为此,本文提出一种新的基于多层“聚类中心”(称为“核心集”)的凝聚聚类算法(MulCA)。该算法创新性地使用了“多层核心集”表述聚类结构,使得每一层数据集向其“核心集”凝聚,同时上层的“核心集”自动成为下层的数据集,随着每层核心集规模按α比例迅速减少,控制了凝聚过程的迭代次数。由于现代社会的快速发展,大规模数据
5、已经成为需要处理数据的主要成员,为此,本文引入了基于随机采样计算ε-核心集(RBC)的技巧,将MulCA算法应用于大规模数据集。并做了实验证明了算法对大规模数据的有效性。在人工和实际数据集上大量的数值试验充分验证了MulCA算法的有效性,以及相比于其他算法的优越性。关键词:多层,核心集,凝聚聚类,大规模I基于多层核心集的凝聚聚类算法AbstractAsanimportantcomponentofunsupervisedpatternclassification,clusteringanalysishasbeco
6、meanmoreandmoreimportanttoolinmoderndataanalysis.Differentstartingconditionsandsimilaritycriterionandclusteringcriterionusuallygeneratedifferentclusteringalgorithms.Therefore,clusteringalgorithmisavastanddiversealgorithmfamily.Sofar,manyresearchershasputforw
7、ardvariousclusteringalgorithms.Manyclassicalclusteringalgorithmslikeaverage-link,K-means,K-medoids,Clarans,Claraandsoonareallbasedonasinglecluster-centerandonlyapttodiscoverconvex-structuredclusters.Othermethods,e.g.,CUREandDBSCAN,usemorethanonepointtorepres
8、entaclusterandcanfindsomewell-separatedclustersofarbitraryshape.However,theyonlythinktheoriginalscaleoftheinputdataandthuscannotdepartover-lappedornoisyclusters.Tothisend,thispaperistoproposeamu
此文档下载收益归作者所有