基于网格的聚类融合算法的研究

基于网格的聚类融合算法的研究

ID:33964246

大小:1.86 MB

页数:48页

时间:2019-03-02

基于网格的聚类融合算法的研究_第1页
基于网格的聚类融合算法的研究_第2页
基于网格的聚类融合算法的研究_第3页
基于网格的聚类融合算法的研究_第4页
基于网格的聚类融合算法的研究_第5页
资源描述:

《基于网格的聚类融合算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、AthesissubmittedtoZhengzhouUniversityforthedegreeofMasterTheStudyofGrid—basedClusteringEnsembleAlgorithmByQiaolingCaoSupervisor:Prof.MingFanComputerSoftwareandTheorySchoolofInformationEngineeringMay2011原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表

2、或撰写过的科研成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。学位论文作者:咯'乃拾日期:训1年箩月≥D日学位论文使用授权声明‘本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成

3、果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。‘学位论文作者:咯玛衿日期:秒11年岁月弘日<▲摘要组合分类方法已被证明是非常普遍和有效地、能够改进学习精确度的监督方法。依据同样的原理,聚类融合的目的是融合来自多个划分的结果以得到更高质量和鲁棒性的聚类结果。目前已经出现了很多的聚类融合算法,大量的理论和实验研究表明:与单个聚类相比,聚类融合具有明显的优势。在众多的聚类方法中,基于网格的方法以网格为单位学习聚簇,速度快、效率高,但它构造的每个聚簇边界成锯齿状,不能很好地识别平滑边界曲面。本文在对己往聚类融合算法进行深入分析的基础上,并结合网

4、格聚类算法的优缺点,提出了一种基于网格的聚类融合算法:旋转网格(RotationGrid,简称RG)。该算法能够有效地解决网格聚类方法中边界处理不平滑问题,RG算法有两个关键的步骤:(1)生成若干个具有差异性的聚类成员;(2)设计融合函数对聚类成员进行融合。本文围绕这两个方面进行了研究。在生成聚类成员方面,RG不是通过随机抽样数据集或随机初始化相关参数来创建有差异的聚类成员,而是迭代的将特征划分为K个数据子集,并使用特征变换得到K个不同的旋转变换基,形成新的特征空间,并将网格聚类算法应用于该特征空间,从而构建有差异的聚类成员;在设计融合函数方面,算法沿用

5、了基于超图的思想,将聚类成员中的每个簇写成单位向量形式,将每个向量看作顶点,构造一个带权超图。依次计算出所有顶点对之间的边权重,并找出边权重最大的两个簇,用相同的标签来标示,然后用投票的方法决定数据集中的每个点所在的簇。通过大量的实验表明,RG算法能够有效地划分任意形状、大小的数据集,并能有效的解决网格聚类中边界处理过于粗糙的问题,其精度明显高于单个网格聚类。关键词:数据挖掘聚类算法聚类融合网格算法特征变换<-Abstract’——————————————————-————————_—————————————————————————————一一-Asas

6、upervisedlearning,ensembleclassificationhasbeenproventobeverypopularandeffectivetoimprovethelearningaccuracy.Basedonthesameprinciple.thepurposeofclusterensembleistoensembletheresultsofmultiplepartitionsinordertogetaclusteringresultwithhigherqualityandrobustness.Currentlytherehave

7、beenmanyclusterensemblealgorithm,alargenumberoftheoreticalandexperimentalresultsshowthat:Comparedwithasinglecluster,clusterensemblehasobviousadvantages..·.Inmanyclusteringalgorithms,thoughitisrapidandefficienttousethe鲥d-basedclusteringapproachtolearnthepartitionofdatasets,themarg

8、inofeachclusterconstructedbytheapproachp

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。