基于支持向量排序的分割聚类算法研究

基于支持向量排序的分割聚类算法研究

ID:35065292

大小:2.89 MB

页数:58页

时间:2019-03-17

基于支持向量排序的分割聚类算法研究_第1页
基于支持向量排序的分割聚类算法研究_第2页
基于支持向量排序的分割聚类算法研究_第3页
基于支持向量排序的分割聚类算法研究_第4页
基于支持向量排序的分割聚类算法研究_第5页
资源描述:

《基于支持向量排序的分割聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP39单位代码:10183研究生学号:2013532096密级:公开吉林大学硕士学位论文(学术学位)基于支持向量排序的分割聚类算法研究PartitioningClusteringAlgorithmResearchBasedonSupportVectorRanking作者姓名:栗寒冰专业:计算机应用技术研究方向:商务智能指导教师:王岩副教授培养单位:计算机科学与技术学院2016年5月基于支持向量排序的分割聚类算法研究PartitioningClusteringAlgorithmResearc

2、hBasedonSupportVectorRanking作者姓名:栗寒冰专业名称:计算机应用技术指导教师:王岩副教授学位类别:工学硕士答辩日期:2016年5月24日未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。否则,应承担侵权的法律责任。吉林大学硕±学位论文原创性声明本人郑重声明:所呈交的硕±学位论文,是本人在指导

3、教师的指导下,独立进行研究工作所取得的成果。除文中己经注明引用的内容外,本论文不包含任何其它个人或集体已经发表或挺写过的作品成果。对本文的研究做出重要贡献的个人和集体。,均己在文中明确方式标明本人完全意识到本声明的法律结果由本人承担■。>^学位论文作者签名;襄芙4日期;2016年S月之备日摘要摘要基于支持向量排序的分割聚类算法研究随着互联网技术的普及,各种信息泛滥、信息冗余的问题日渐增多,如何帮助用户找到、提炼其中的潜在价值信息推动了对海量数据进行分类的研究。聚类算法可

4、以探索数据集分布情况并能将其进行聚类,它是数据挖掘的重要工具和统计分析方法。目前,聚类分析在各类学科和行业等都有普遍的应用。常用的聚类方法根据其算法思想的不同可以归纳为以下几类方法:基于划分法、基于模型法、基于密度法、基于网格法以及层次法。随着聚类方法的不断深入研究,聚类方法体系的不断完善,核聚类算法逐渐受到关注。支持向量聚类(SupportVectorClustering,SVC)算法就是一类基于核的聚类分析方法。相比于其他的聚类算法,支持向量聚类有一些特别的优势:第一,SVC对数据集的形状和数目

5、没有特别要求,可以识别任何分布状态的簇。第二,SVC可以识别一部分噪声数据点并能够分类相互交错重叠的簇。第三,SVC利用核函数的思想实现数据空间到特征空间的非线性与线性转换,可处理结构复杂的数据。但是SVC仍然存在一定的缺陷,它的高耗费和低性能也影响到了它的广泛应用。而一种基于相似度的点排序分割聚类算法正好可以弥补SVC算法在算法性能上的不足,该算法在数据处理上速度较快,聚类质量也比一般的聚类效果要好,但是由于其在点排序阶段未加处理的直接根据距离度量对所有的样本点进行排序,使得同簇的样本点被拆开排到

6、其他簇的元素之中,造成非同簇元素间的错排,在某种程度上也影响了聚类质量。综合支持向量聚类和点排序分割聚类这两种算法各自的优缺点,本文提出一种基于支持向量排序的分割聚类算法(PartitioningClusteringBasedonSupportVectorRanking,PC-SVR)。该算法从理论上继承了这两种算法的一些优点,并有效地避免了它们各自的一些缺点,既保证了聚类质量,又提高了聚类的速度。为验证PC-SVR算法的可行性与聚类性能,本文分别使用了两组人工模拟数据集和四组真实数据集进行实验,并

7、与其他几种经典聚类算法做对比,聚类结果表明此算法具有可行性并且运行效率和聚类质量相较于一般聚类算法表现要好。I摘要关键词:聚类分析,支持向量排序,分割聚类,核宽度系数,惩罚因子IIAbstractAbstractPartitioningClusteringAlgorithmResearchBasedonSupportVectorRankingWiththedevelopmentofInternettechnology,allkindsofproblemssuchasinformationfloodi

8、ngandredundancyarebecomingmoreandmore.Sohowtohelpusersfindandextractthepotentialvalueofinformationpromotestheresearchonclassificationofmassivedata.Clusteringalgorithmisastatisticalanalysismethodwhichcanbeusedforexploringandclassifyingth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。