网格聚类算法的研究

网格聚类算法的研究

ID:34441455

大小:4.97 MB

页数:59页

时间:2019-03-06

网格聚类算法的研究_第1页
网格聚类算法的研究_第2页
网格聚类算法的研究_第3页
网格聚类算法的研究_第4页
网格聚类算法的研究_第5页
资源描述:

《网格聚类算法的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、华北电力大学(保定)硕士学位论文网格聚类算法的研究姓名:程伟想申请学位级别:硕士专业:计算机应用技术指导教师:孟建良20081218摘要近年来,基于网格聚类算法的研究己经成为数据挖掘研究领域中非常活跃的一个研究课题。本文在研究了传统聚类算法的基础上,提出了基于优化网格的最小生成树聚类算法(0GMST)。该算法利用参数自动化的密度阈值处理技术,来解决基于网格的最小生成树聚类算法不适用于多密度数据集的局限性,利用边界点提取技术提取边界点,提高了现有的多密度聚类算法的精度。针对传统的对象间相似度的度量方法的缺陷,提出了基于网格相似度的聚类

2、算法(GSCA)。该算法引入了一种新的相似度度量标准,并将其应用于网格聚类,使用密度阈值处理技术来定义网格的密度阈值,提高了聚类的精度,同时还利用信息熵的概念对高维数据集进行了处理。两种算法在与传统算法的对比实验中均显出一定的优越性。关键词:网格聚类,密度阈值,边界点,相似度ABSTRACTTheresearchongrid·basedclusteringalgoritluIlshaVebecomeahighlyactivetopicinthedomainofdataminingresearch.BasedontheanaIysis

3、oftraditionalgrid.basedcluSteringalgorithIns,、veb“ghtf-0nVardtheMSTClusteringAJgoritI衄BasedonOptimized硎d(OGMST).ItrcsolvestheGMST(Grid-b豁edMSTClusteringAlgoritlllll)algorittml.sli以tati∞of岫fitformult“ens时da阪埝bytheu辩ofpa衄ct盯automaticdensitythresholdmethod.Besides,theOGMS

4、Talgorithmdisposestheborderpointsbythemethodofborderpointsdisposedtechniquethatenhancesremarkablythcprecisionofgrid-basedclustering.Aimingatthelimitationsoftraditionalmeasurementmethodonsimilitudebet、veenobjects,weputforward(矾d—Similarity-b邪edClusteringAlgoritllln(GSCA

5、),itbringsinanewcriteriontomeasurettlesimilitudebetweenobjects.ItappliesonthegridclusteringanddisposesthedensitytllresholdofgridbythcmethodofdensitythresholdthatimproVestheprecisionofclustering.Bcsidcs,theGSCAalgofitlulldisposestheVer,rhighdimensiondatasetsbythctechniq

6、ucofentropy.ThetwoalgoritluIlsshowtheiradVantagesinthese“esofcomparativccxperimentswithsometraditionalclusteringalgorithms。ChengWeixiang(ComputerAppIicationT’echnology)DirectedbyViceprof.MengJianliangl‘EYWORDS:grid-basedclustering,densitythreshold,borderpoints,similari

7、ty摘要近年来,基于网格聚类算法的研究己经成为数据挖掘研究领域中非常活跃的一个研究课题。本文在研究了传统聚类算法的基础上,提出了基于优化网格的最小生成树聚类算法(0GMST)。该算法利用参数自动化的密度阈值处理技术,来解决基于网格的最小生成树聚类算法不适用于多密度数据集的局限性,利用边界点提取技术提取边界点,提高了现有的多密度聚类算法的精度。针对传统的对象间相似度的度量方法的缺陷,提出了基于网格相似度的聚类算法(GSCA)。该算法引入了一种新的相似度度量标准,并将其应用于网格聚类,使用密度阈值处理技术来定义网格的密度阈值,提高了聚类

8、的精度,同时还利用信息熵的概念对高维数据集进行了处理。两种算法在与传统算法的对比实验中均显出一定的优越性。关键词:网格聚类,密度阈值,边界点,相似度ABSTRACTTheresearchongrid·basedclusteringal

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。