基于遗传算法的聚类挖掘研究

基于遗传算法的聚类挖掘研究

ID:33234594

大小:2.93 MB

页数:76页

时间:2019-02-22

基于遗传算法的聚类挖掘研究_第1页
基于遗传算法的聚类挖掘研究_第2页
基于遗传算法的聚类挖掘研究_第3页
基于遗传算法的聚类挖掘研究_第4页
基于遗传算法的聚类挖掘研究_第5页
资源描述:

《基于遗传算法的聚类挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、安徽大学硕士学位论文基于遗传算法的聚类挖掘研究姓名:苏守宝申请学位级别:硕士专业:计算机及应用指导教师:倪志伟20040501安徽大学硕士学位论文基于遗传算法的聚类挖掘研究摘要聚类分析也是数据挖掘研究中的一个非常活跃的研究课题。聚类就是把一个没有类别标畦的样本集按某种准!llIj划分成若干类,使类内样本的相似性尽可能大,而类间样本相似性尽量小,是一种无监督的分类方法。聚类分析虽已广泛地应用于模式谚{别、数据挖掘、计算机视觉、模糊控制、决策分析和预测等许多领域,但它在理论和方法上仍不完善,甚至还有严重的不足之处。对聚类算法的进一步优化研究将不仅有

2、助于算法理论的完善,更有助于算法的推广和应用。该课题研究的目标就是在数据挖掘的背景下,从理论、算法和应用的角度对聚类分析技术在如下三个方面进行了探索性的研究并取得了一定的成果。1)现有聚类算法的分类研究。从聚类准则、聚类的表示、算法框架等不同角度来考察并区分这些算法,然后从混合聚类方法、增量聚类、自动化和可视化等技术方面对现有算法加以比较分析评价。分析了现有算法的优缺点,以利于进一步改进;通过对现有算法的性能评述,有利于数据挖掘用户能够针对特定的数据集选择币确的算法,以获得最优化的结果和性能;也可以为现有算法分类比较的进一步研究以及建立聚类基准

3、奠定基础。2)聚类分析的遗传算法研究。传统的基于聚类准则的聚类算法本质上是一种局部搜索算法,它们采用了一种迭代的爬山技术柬寻找最优解,存在着对初始化敏感和容易陷入局部极小的致命缺点。遗传算法(GA)是~种通过模拟自然进化过程搜索最优解的方法,其显著特点是隐含并行性和对全局信息的有效利用能力。文中讨论了聚类分析的遗传操作改进方法,首次提出了基于佳点集GA的聚类算法GA】Tleans,降低了传统聚类算法对初始化的要求,具有收敛快、较强的稳健性和可避免早熟的特点。提出了一种混合聚类方法HgaⅥeans,实验比较测试表明它具有更好的聚类质量和综合性能。

4、3)增量算法探讨:增量式聚类方法有适应大规模、动态数据、降低内存需求、可实现并行处理和增量更新等诸多优点,而且时空复杂性较小。增量算法的要求是聚类特征一般是可加的、非迭代的,该文提出了一种基于密度的网格聚类算法GDCLuS,并在此基础上提出了增量式算法IGDCLuS。该算法可发现任意形状的聚类,适用于数据的批量更新,具有高的效率且容易实现。目前的增量算法尚未完全解决对数据顺序的敏感性,高效、自适应性和交互性地动态地增量式聚类算法有待进一步研究,数据挖掘中的聚类技术仍面临着许多问题和挑战。关键词:聚类;遗传算法;数掘挖掘;增量算法;佳点集。安敞大

5、学r乇贞士学位论文摘要ABSTRACTCIusterInganaJVsisisOneOfmOstheatedresearchtOpIcoftheday.DatacJustering,aunsuperVisedcIassifyingmethOd,istheprOcessOfgrOupingtOaethersimi

6、armuItl-dimensiOnaIdatavectOrsintOanunlberOfcIustersOrbins.CIusteringtechniquehavebeenappIiedt0awiderangeOfprObIems,in

7、cIudjngpatterncOgnniOn,datamining,decisiOn-analyzingandpredictiOn,etc.,、,et陀isimpe盹ctboththeOreticaIfyandmethOdolOgica玎y1evenseverefauIt.0ptimizjngdeepIyclusterIngalgor计hmsw川notonIyheIptoperfectitstheorv,butaIsOhelptOltspOpuIa—za石OnandappIicatiOmThisthesisaImedatstudVinafOII

8、OwinathreeasDectsofcIusterinaanalVslsfrOmitStheOrMaIgOrnhmsandappIicati0几Sjndatamj几ing.FIrstIv.cIassifjcatiOnofpOpuIarcluste—nqalaOrithmsisStudied.MOstexistingclUsterIngaIgOrithmSareClaSsjfiedandinter—cOnlparedfrOmthreed.竹erentviewpOintS,九amelVCluSterInac—teria,clusterrepres

9、entatiOn,andalaorithmframewOrk,a九danalVsedandevaluatedwIthhyb—dmethods,incr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。