一种改进的谱聚类方法及其应用研究

一种改进的谱聚类方法及其应用研究

ID:37034939

大小:2.26 MB

页数:53页

时间:2019-05-17

一种改进的谱聚类方法及其应用研究_第1页
一种改进的谱聚类方法及其应用研究_第2页
一种改进的谱聚类方法及其应用研究_第3页
一种改进的谱聚类方法及其应用研究_第4页
一种改进的谱聚类方法及其应用研究_第5页
资源描述:

《一种改进的谱聚类方法及其应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中图分类号:公开:O235密级'UDC::59100821.6学校代码Ty^〇CEFSCIENHEBEIUNIVERSITYOFSCIENCEANDTECHNOLOGY硕士学位论文一种改进的谱聚类方法及其应用研究、论文作者:李澄瑶指导教师:阎晨光副教授副指导教师:申请学位类别:理学硕士学科、领域:数学所在单位:理学院答辩日期:2018年5月ClassifiedIndex:O235SecrecyRate:PublicizedUDC:519.6Universi

2、tyCode:10082HebeiUniversityofScienceandTechnologyDissertationfortheMasterDegreeAnImprovedSpectralClusteringMethodandItsApplicationCandidate:LiChengyaoSupervisor:A/Prof.YanChenguangAssociateSupervisor:AcademicDegreeAppliedfor:MasterofScienceSpeciality:Mathematics

3、Employer:CollegeofSciencesDateofOralExamination:May,2018摘要摘要随着人类社会的发展和进步,人们生活中的数据呈现出更多的复杂性、异构性。面对这些纷繁复杂的数据,分类分析往往是一类较为简单有效的方法。聚类分析便是一类广义的分类方法,它可以在某些条件下实现数据的自动分类,对数据进行筛选和处理,不仅让数据的规律性、可靠性大大增强,还可以提取出一些有价值的信息。谱聚类方法是近年来出现的一类性能优越的聚类算法,能对互不交叉的任意形状数据进行聚类。原始的谱聚类算法可以很好的呈现

4、出数据的本质特征,并将其归类。但在数据之间存在交叉的情形下,谱聚类方法的效果则不甚理想,主要原因是谱聚类算法在设定权值时所考虑的要素太过单一,容易导致算法稳定性较差,受到噪声或其他因素的影响。针对谱聚类算法的这一缺陷,本文基于欧氏距离与测地线距离设计了一种改进的谱聚类算法,综合考虑数据点之间的距离特性和几何性质进行聚类。首先介绍了聚类算法及谱聚类算法的基本概念和理论基础,分析了谱聚类算法中已有的研究成果及应用现状,然后总结得出谱聚类研究领域中的几个关键性问题。其次,本文重点分析了多重流形谱聚类算法与传统谱聚类算法的异同

5、。在综合考虑两种方法优缺点的基础上,针对传统的谱聚类算法中相似度矩阵的构造问题,定义了一种新的距离度量,用欧氏距离与测地线距离构造新的结构权值,以此来构造新的权重矩阵,提出了一种改进的谱聚类算法。最后对比分析了谱聚类算法、多重流形谱聚类算法,以及本文提出的改进算法这三种方法的聚类结果,并进行算法复杂度分析。结果表明:本文提出的改进算法可以处理存在交叉情形的样本数据点,性能更加完善,得到的聚类结果更加理想。关键词聚类;局部切空间;流形聚类;谱聚类;测地线距离IAbstractAbstractWiththedevelopm

6、entandprogressofhumansociety,moreandmorecomplexdataarepouringintopeople'slive.Todealwiththesedisorderlydata,clusteringanalysisisalwaysthemostsimplyandeffectivemethod.Beingakindofgeneralizedclassificationmethod,clusteringanalysiscouldclassifydataautomaticallyunde

7、rcertainconditions,screenandprocessthedata.Theresultincludingnotonlyenhancetheregularityandreliabilityofthedata,butalsoextractvaluableinformation.Spectralclusteringmethodisakindofclusteringalgorithmwithsuperiorperformance.Itcouldworkfortheintersectingdatawitharb

8、itraryshape.Theoriginalspectralclusteringalgorithmpresentstheessentialfeaturesofdataperfectlyandcouldclassifytheoriginaldata.Butwhenthereisacross-overbetweenthedata,t

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。