欢迎来到天天文库
浏览记录
ID:33166124
大小:820.06 KB
页数:59页
时间:2019-02-21
《基于核学习方法的聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中图分类号:TP391.4密级:公开UDC:本校编号:硕士学位论文论文题目:基于核学习方法的聚类算法研究研究生姓名:王英奇学号:0206508学校指导教师姓名:李军职称:副教授申请学位等级:工学硕士学位专业:计算机软件与理论论文提交日期:2009.04论文答辩日期:2009.06万方数据独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含获得兰州交通大学或其他教育机构的学位或证书而使用过的材料。与我一
2、同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名:签字日期:年月日学位论文版权使用授权书本学位论文作者完全了解兰州交通大学有关保留、使用学位论文的规定。特授权兰州交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:导师签名:签字日期:年月日签字日期:年月日万方数据硕士学位论文基于核学习方法的聚类算法研究
3、ResearchonClusteringAlgorithmsusingKernel-BasedLearningMethod作者姓名:王英奇学科、专业:计算机软件与理论学号:0206508指导教师:李军完成日期:2009.04兰州交通大学LanzhouJiaotongUniversity万方数据兰州交通大学硕士学位论文摘要数据挖掘是一个多学科交叉研究领域,与机器学习和统计学紧密相关。作为数据挖掘核心内容之一的聚类是将物理或抽象对象的集合聚成由类似对象组成多个类的过程。这种方法所具有的“无监督”性,使它在机器学习、模式识别
4、等众多领域有着重要的应用。近年来,随着统计学习理论的不断完善,基于核学习的方法不断提出。本文以聚类相关理论为基础,用核学习方法来处理数据挖掘中的聚类问题,并重点对核K-均值聚类算法和支持向量聚类算法进行研究。核K-均值算法首先将原空间中待聚类的样本经过一个非线性映射,映射到一个高维的核空间中,然后在这个核空间中进行K-均值聚类。由于经过核函数的映射,使原来没有显现的特征突现出来,从而能够更好的聚类。在统计学习理论的基础上,支持向量机是20世纪90年代中期提出的一种新的机器学习方法,它将最大间隔原则和核函数理论结合在一起
5、,有效解决了机器学习领域中的高维小样本学习难题。支持向量聚类是一种基于支持向量机的新颖聚类方法,与其它传统聚类方法相比较,该方法可调参数少,容易处理高维数据,能得到全局最优解,具有能处理任意形状的聚类且无需指定聚类数目等优点。本文主要研究成果包括如下几个方面:(1)研究了层次聚类,K-均值聚类和自组织映射聚类3种经典聚类算法。(2)基于经典的K-均值聚类算法和支持向量机理论,在核学习方法基础上,研究了核K-均值聚类算法以及支持向量聚类算法,并给出了一种改进的支持向量聚类算法。(3)为验证算法的有效性,使用人工数据集和标
6、准数据集研究了核K-均值聚类算法以及支持向量聚类算法的性能。通过算法在不同参数下的性能分析,以及与经典聚类算法的比较实验,结果表明,上述基于核学习方法的聚类算法具有算法稳定性好,且聚类效果理想的显著优势。关键词:聚类;核K-均值聚类;支持向量聚类;支持向量机;核学习论文类型:基础研究-I-万方数据兰州交通大学硕士学位论文AbstractThedataminingisamulti-disciplinaryoverlappingresearcharea,whichiscloselyrelatedwiththemachine
7、learningandstatistics.Asamainideaofdatamining,theclusteristheprocessofgatheringasetofphysicalorabstractobjectintoclassesofsimilarobject.Asthismethodwith"nosupervision"hasimportantapplicationsinmanyways,suchasmachinelearning,patternrecognizeandsoon.Inrecentyears,
8、withtheconsummationofthestatisticstheoryoflearning's,thekernel-basedlearningmethodshavebeenproposedconstantly.Onthebaseofrelatedknowledgeofcluster,thispaperdealswitht
此文档下载收益归作者所有