欢迎来到天天文库
浏览记录
ID:34441455
大小:4.97 MB
页数:59页
时间:2019-03-06
《网格聚类算法的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、华北电力大学(保定)硕士学位论文网格聚类算法的研究姓名:程伟想申请学位级别:硕士专业:计算机应用技术指导教师:孟建良20081218摘要近年来,基于网格聚类算法的研究己经成为数据挖掘研究领域中非常活跃的一个研究课题。本文在研究了传统聚类算法的基础上,提出了基于优化网格的最小生成树聚类算法(0GMST)。该算法利用参数自动化的密度阈值处理技术,来解决基于网格的最小生成树聚类算法不适用于多密度数据集的局限性,利用边界点提取技术提取边界点,提高了现有的多密度聚类算法的精度。针对传统的对象间相似度的度量方法的缺陷,提出了基于网格相似度的聚类
2、算法(GSCA)。该算法引入了一种新的相似度度量标准,并将其应用于网格聚类,使用密度阈值处理技术来定义网格的密度阈值,提高了聚类的精度,同时还利用信息熵的概念对高维数据集进行了处理。两种算法在与传统算法的对比实验中均显出一定的优越性。关键词:网格聚类,密度阈值,边界点,相似度ABSTRACTTheresearchongrid·basedclusteringalgoritluIlshaVebecomeahighlyactivetopicinthedomainofdataminingresearch.BasedontheanaIysis
3、oftraditionalgrid.basedcluSteringalgorithIns,、veb“ghtf-0nVardtheMSTClusteringAJgoritI衄BasedonOptimized硎d(OGMST).ItrcsolvestheGMST(Grid-b豁edMSTClusteringAlgoritlllll)algorittml.sli以tati∞of岫fitformult“ens时da阪埝bytheu辩ofpa衄ct盯automaticdensitythresholdmethod.Besides,theOGMS
4、Talgorithmdisposestheborderpointsbythemethodofborderpointsdisposedtechniquethatenhancesremarkablythcprecisionofgrid-basedclustering.Aimingatthelimitationsoftraditionalmeasurementmethodonsimilitudebet、veenobjects,weputforward(矾d—Similarity-b邪edClusteringAlgoritllln(GSCA
5、),itbringsinanewcriteriontomeasurettlesimilitudebetweenobjects.ItappliesonthegridclusteringanddisposesthedensitytllresholdofgridbythcmethodofdensitythresholdthatimproVestheprecisionofclustering.Bcsidcs,theGSCAalgofitlulldisposestheVer,rhighdimensiondatasetsbythctechniq
6、ucofentropy.ThetwoalgoritluIlsshowtheiradVantagesinthese“esofcomparativccxperimentswithsometraditionalclusteringalgorithms。ChengWeixiang(ComputerAppIicationT’echnology)DirectedbyViceprof.MengJianliangl‘EYWORDS:grid-basedclustering,densitythreshold,borderpoints,similari
7、ty摘要近年来,基于网格聚类算法的研究己经成为数据挖掘研究领域中非常活跃的一个研究课题。本文在研究了传统聚类算法的基础上,提出了基于优化网格的最小生成树聚类算法(0GMST)。该算法利用参数自动化的密度阈值处理技术,来解决基于网格的最小生成树聚类算法不适用于多密度数据集的局限性,利用边界点提取技术提取边界点,提高了现有的多密度聚类算法的精度。针对传统的对象间相似度的度量方法的缺陷,提出了基于网格相似度的聚类算法(GSCA)。该算法引入了一种新的相似度度量标准,并将其应用于网格聚类,使用密度阈值处理技术来定义网格的密度阈值,提高了聚类
8、的精度,同时还利用信息熵的概念对高维数据集进行了处理。两种算法在与传统算法的对比实验中均显出一定的优越性。关键词:网格聚类,密度阈值,边界点,相似度ABSTRACTTheresearchongrid·basedclusteringal
此文档下载收益归作者所有