欢迎来到天天文库
浏览记录
ID:37027978
大小:3.60 MB
页数:43页
时间:2019-05-16
《两类基于稀疏相似度矩阵的谱聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号0241.5编号.乂暴,4:,鼻,生¥.:奪息W.1__#||議论文题目两类基于稀疏相似度矩阵的谱聚类算法研究:者姓為张雅茶九着指导教师黄正达教授'■;学科专业计算数学();>^t所在学院数学科学学院提交日期二零:'々零矿解三月卜期:^独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得浙江大学或其他教育一机构的学位或证书而使用过的材
2、料。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名字日期:年月》日W)学位论文版权使用授权书、本学位论文作者完全了解浙江大学有关保留使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权浙江大学可以将学位论文的全部或部分内容编入有关数据、库进行检索,可以采用影印、缩印或扫描等复制手段保存汇编学位论文。()保密的学位论文在解密后适用本授权书___导师签—学位论文作者签名名:&签字曰期:>丨?月6曰签字曰期:>姅?月广日
3、/学位论文作者毕业后去向:工作单位::电话通讯地址:邮编摘要随着数据挖掘的迅速发展,非线性可分数据的聚类问题成为聚类研宄一-的热点之.对这类问题若只采用传统聚类方法如欠均值算法聚类结果,,一1N-往往并不理想.为此200年g、Jordan和Weiss构造了种结合X均值算法,的NJW谱聚类算法,该算法不仅可以解决非线性可分数据的聚类问题,还.在实现NJW谱聚类算法时.可以得到全局最优解,往往需要先确定参数72004年Manor和Perona通过实验得出NJW谱聚类算法非常依赖参数7的取值范se-t围lfunin谱聚类算法
4、.在算法中参数7通过自适应计算,并提出了自适应(g),得到.自此减少谱聚类算法对参数7取值范围的依赖性或改善7的选取成为了,一-谱聚类算法的研宄目标之.比如2012fc共享近邻自适应谱聚,年罗怀金构造了类算法.基于相似度矩阵的稀疏化及选择不同的距离,本文提出了基于稀疏相自适应se-ti谱聚似度矩阵的定参谱聚类算法和基于稀疏相似度矩阵的lfunn(g)类算法.与上述NJW谱聚类算法不同的是,在基于稀疏相似度矩阵的定参谱聚类算法中们利用Mahas-lanobi距离计算数据点之间的相似度通过对fc共享近邻,我,点的判定将相似度矩阵稀疏化并
5、采用最大距离法选取初始聚簇中心的瓦-均值,JW算法实现算法的聚类.针对常用数据集实验验证了相比于N谱聚类算法本,文所提出的算法对参数^取值范围的依赖性要小.与上述自适应谱聚类算法和A-:共享近邻自适应谱聚类算法不同的是本文,A-所提出的基于稀疏相似度矩阵的自适应谱聚类算法基于:共享近邻判定对相似度矩阵进行稀疏化,利用数据集不同的局部结构特征,采用Grassmann距离自适-.在Swsroll、双圆环数据集、半月型数据集和散点数据集应计算参数7is数据集上的对比实验表明,与自适应谱聚类算法和I共享近邻自适应谱聚类算法相比Sw-本文所提
6、出的自适应谱聚类算法在issroll数据集上聚类的正确率要高.关键词:非线性可分数据;谱聚类;稀疏相似度矩阵Mahalanobis距离;Grassmann;距离Abstractiddeveingi?Withtheraplopmentofdatamintheclusternroblemofnon,gplinearseparabledatahasbecomeoneofthehotspotsinclusterresearch.Thec_meanslusteringresultsofthes
7、eproblemsbytraditionalmethodssuchasi^,algorithmareusuallynotideal.In2001NgJordanandWeissconstructed,,,teectra-hNJWsplclusteringalgorithmcombinedwithJCmeansalgorithm.Thisalgorithmcannotonlysolvetheclusteringproblemofnonlinearseparablebutalso
8、gett
此文档下载收益归作者所有