欢迎来到天天文库
浏览记录
ID:50116651
大小:3.70 MB
页数:52页
时间:2020-03-05
《基于特征间隙检测簇数的谱聚类算法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、.'*-\\:.勺HIt的'.rF巧聲、遺?..端.診皆淑;.rr:藻;參;5|3掌过?'r,讀馨/馨?度>議:;?’:^相v<I舊i'-.冷i!.迫K^璋致該V.&端凌:势膚'r鳴惠ftI^.r讀.乂j.-;-^硕女b您從i,.;代‘.-,<r;■.■神每.片,7-f‘;骑,二r二;赛斗島V、;討.封?方公烹马/脖f.'必.苗篇马巧.:;.f."-一马.馨护F,.,.1^.;、疼";-'.<V化题扣f征鎌I簇隊|^完'迦,:。,二,;...>;;.I;.iF.、.I敎麻f惠V;狱麵.f詔’吉
2、-学!W1W繁、r夢、''’.%姓文1萍>.i.窒J导师6鱗峰..—起f&ii^-信;-学业,:.V■\研;穆通前捕I.:i>..串请^工学击户f累':.;论文W1^r..,...7.狀:11-C%讀斯;}A::、新l一養:。;:寧舊r>:.靈於;纪;修\'赛l在;■於苗v肩,、\枉;占.;;.i;々鍊:0赛;奈、"夢I南京邮电大学学位论文原创性声明尽本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。我所知,除了文中特别加IU标注和致
3、谢的地方外,论文中不包含其他人已经发表或撰写过的研巧成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。一与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。一本人学位论文及涉及相关资料若有不实,愿意承担切相关的法律责乂任。研巧生签名:碑碎日期:作叫南京邮电大学学位论文使用授权声明本人授权南京邮电大学可1^保留并向国家有关部0或机构送交论文的复印件和电子文档可;允许论文被查阅和借阅;可[^将学位论文的全部或部分内容编入有关数据库进行检索;论W采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文
4、电子文档的内容和纸质一致文涉的内容相。论文的公布(包括刊登)授权南京邮电大学研巧生院办理。密学位论文在解密后适用本授权书。: ̄研巧生签名:导师签氣&1養L日期:.斗'化叫^斗^ResearchonSpectralClusteringwithIdentifyingClusteringNumberbasedonEigengapThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByLiuPing-pingSupervisor:P
5、rof.HuHai-fengApril,2015摘要谱聚是聚类的一个重要分支。谱聚类算法不同于其他传统聚类算法,它将聚类问题转化成图的最优划分问题。谱聚类算法不关心数据集的形状,能处理复杂、高维非球形的数据样本。同时,谱聚类算法实现简单,计算复杂度小,非常适合处理大型数据集,可应用到分布式系统中去,并能获得全局最优解,改善聚类效果。谱聚类算法的难点之一是聚类簇数k值的检测。大多数聚类算法都需要人工提前来设定聚类簇数,而不合适的聚类簇数会导致不理想的聚类效果,甚至会使聚类过程失去意义。另外,谱聚类算法的另一个研究热点是分布式谱聚。集中式的谱聚类算法不能直接适用于分布式系统。对此
6、,本文对传统的谱聚类算法作出了如下改进:首先,本文提出了一种基于特征间隙的簇数检测(IdentifyingClusteringNumberbasedonEigengap,ICNE)算法。通过构建基于邻接矩阵的规范拉普拉斯矩阵,顺序求解拉普拉斯矩阵的特征解,计算矩阵相邻特征值的间隙,判断出特征间隙的所在位置,确定簇数k,ICNE方法只需求解出前k个特征解,从而减少了特征求解的计算量,实现了快速有效地确定聚类簇数k。其次,提出了一种基于ICNE方法的分布式谱聚类(DecentralizedSpectralClusteringwithIdentifyingClusteringNum
7、berbasedonEigengap,DSC-ICNE)方法,以分布式方式完成自动谱聚类,使得谱聚类方法可以应用于分布式系统,提高谱聚类算法的可扩展性。最后,提出了基于特征间隙检测簇数的谱聚类(SpectralClusteringwithIdentifyingClusteringNumberbasedonEigengap,SC-ICNE)算法,在ICNE算法的基础上快速有效地确定聚类簇数k,完成谱聚类算法。并对SC-ICNE算法在UCI数据库上进行了仿真,仿真结果表明,SC-ICNE算法能够快速有效地实
此文档下载收益归作者所有