欢迎来到天天文库
浏览记录
ID:33103693
大小:3.01 MB
页数:76页
时间:2019-02-20
《基于网格和信息熵的聚类算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代号:10532学号:S08094002密级:湖南大学硕士学位论文基于网格和信息熵的聚类算法Grid-basedandInformationentropy--basedClusteringAlgorithmbyZHOUY
2、uelaiB.E.(TaiyuanInstituteofTechnology)2008AthesissubmittedinpartialsatisfactionoftheRequirementsforthedegreeofMasterofScienceControlScienceandEngineeringi
3、ntheGraduateSchoolofHunanUniversitySupervisorApril,2011栅1㈣2舢5删5Ⅲ0舢9Ⅲ⋯Ⅲ●I舢Y湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:J氮7影隶日期:2.-01(年罗月≥卵学位论文版权使用授权书本学位论文作者完全了
4、解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密口,在年解密后适用本授权书。2、不保密叭(请在以上相应方框内打“√’’)作者签名:导师签名:闯棘物赡日期:加lf年r月≯r日日期:刎,f年厂月刀瑁基于网格和信息熵的聚类算法摘要数据挖掘就是从海量含有噪声和不规律的数据中,提取隐含在其中有趣的但并不为人们所知道的信息、规
5、律或知识的过程。在数据挖掘领域,聚类已经在模式识别、图像处理和市场研究等领域中得到广泛地应用,所以对聚类的研究有着重要的理论与实践的意义。在聚类分析中,虽然现有的很多聚类算法能发现任意形状、任意大小的类,但用于多密度的数据集时却难以取得令人满意的结果。为提高对多密度数据集的聚类效果,文章从以下几个方面进行了研究:(1)首先简要的概述了数据挖掘的一些基本知识,同时对数据挖掘过程中的一些数据预处理方法做了简单必要的介绍。最后分析了一些常见的聚类算法的特点以及对比它们的优缺点。,(2)在基于网格的聚类分析中,网格划分的方法对聚类的结果有
6、着重要的影响,本文对网格划分方法进行了比较系统的论述,介绍了在不同网格划分方法的特点。在进行聚类分析时,网格边界点的处理对聚类的精度也有着一定的影响,所以文章又分析了几种不同的网格边界点的处理方法,并提出了一种新的网格边界点的处理方法。(3)文章在优化信息熵的基础上,提出了一种基于网格和信息熵的多密度聚类算法,它根据不同密度的网格所携带的信息熵,自动计算出密度阈值,找出在多密度数据集中不同的类。实验证明,该算法能有效的去除噪声,发现多密度的类,具有较好的聚类效果。最后,将提出的一种基于网格和信息熵的多密度聚类算法应用在图像分割上。
7、实验证明,这种聚类算法在图像分割中是有效的。关键词:数据挖掘;聚类分析;密度聚类;网格聚类;信息熵II硕士学位论文AbstractDataminingistheprocesswhichtoextracttheinformation,rules,orknowledgewhichinterestingbutnotforpeopletoknow,fromthelargenumberofnoisyandirregulardata.Inthefieldofdatamining,clusteringhasbeenwidelyappliedin
8、patternrecognition,imageprocessingandmarketresearch,Therefore,theresearchonclusteringhasimportanttheoreticalandpracticalsignificance。Intheclusteranalysis,althoughmanyexistingclusteringalgorithmcanfindthearbitraryshapeanddifferentsizeclusters,butitisdifficulttoobtainsa
9、tisfactoryresultsformulti-densitydataset.Inordertoimprovethe.qualityandefficiencyofclusteringalgorithm,thefollowingaspectswe
此文档下载收益归作者所有