聚类算法及聚类有效性指标的研究

聚类算法及聚类有效性指标的研究

ID:35095752

大小:3.71 MB

页数:59页

时间:2019-03-17

聚类算法及聚类有效性指标的研究_第1页
聚类算法及聚类有效性指标的研究_第2页
聚类算法及聚类有效性指标的研究_第3页
聚类算法及聚类有效性指标的研究_第4页
聚类算法及聚类有效性指标的研究_第5页
资源描述:

《聚类算法及聚类有效性指标的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级硕士学位论文题目:聚类算法及聚类有效性指标的研究英文并列题目:ResearchofFuzzyClusteringAlgorithmandClusterValidityindex研究生:赵娜娜专业:计算机科学与技术研究方向:计算机应用与技术导师:钱雪忠指导小组成员:学位授予日期:2016年6月答辩委员会主席:吴小俊江南大学地址:无锡市蠡湖大道1800号二○一六年五月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加W掠注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含本人为获得江南

2、大学或其它教育机构的学位或证书而使用过的材料一。我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名。‘日:日期:2起所挪^|啤t同关于论文使用授权的说明本学位论文作者完全了解江南大学有关保留、使用学位论文的规定:江南大学有权保留并向国家有关部口或机构送交论文的复印件和磯盘,允许论文被查阅和借陶,可学位论文的全部或部分内容编入有关数据库进行检索,可W采用影印、缩印或扫描等复制手段保存、汇编学位论文,并且本人电子文挡的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。签名:导师签名:日期!

3、之。H挪岛弓摘要摘要聚类分析技术作为数据分析的一种方法,应用十分广泛。其中,模糊聚类能够有效地处理事物的不确定性和模糊性,能够客观地反映现实世界和事物的本质,已经成为数据聚类理论中的重要一部分。模糊C均值(Fuzzyc-means,FCM)算法是最为常用的模糊聚类技术之一,在数据挖掘、人工智能和图像处理等领域被广泛应用。虽然FCM算法具有简单、高效、易于在计算机上实现等优点,但是还是存在一些缺陷,比如,需要预先设定数据的划分数、开始每一个类中心的选择容易影响划分的效果、容易受到噪点和孤立点的影响等等。针对上述FCM存在的一些缺陷,我们提出了对应的改进方法,本文主要从以下方面作

4、了改进:(1)对于FCM算法不能预知数据的分类数,新的聚类有效性指标CSO被提出,该指标考虑了聚类的紧致度、重叠度和分离度。实验结果证明,新的指标均能发现最优聚类数,从而证明克服了FCM算法聚类数需要预先设定的缺点,并且能够准确判断含有交叠子类的最佳聚类数。(2)本文将FCM算法与PSO算法相结合,重新设计了适应度函数,进而提出了一个改进的聚类算法。该算法利用了PSO算法具有较强的全局搜索能力和收敛能力的优势解决FCM算法的初始聚类中心的选取,并且采用了FCM算法目标函数与聚类中心距离两方面结合设计了新的适应度函数。实验结果证明,新改进的算法一定程度上避免了FCM算法容易陷入局部

5、最优的问题。(3)最后,将新改进的算法与新的指标相结合,将其应用到图像分割中。该算法先利用新的指标CSO估取图像的最佳分割数目,结合改进的FCM算法应用到图像分割。实验结果证明,该算法能够取得很好的分割效果。关键词:模糊c均值算法;聚类有效性指标;初始聚类中心;图像分割IAbstractAbstractClusteringanalysisasamethodofdataanalysisappliedverywidely.Amongthem,thefuzzyclusteringtechnologycandealwiththeuncertaintyandfuzzinessofthing

6、seffectively,whichcanobjectivelyreflecttherealworldandthenatureofthingshasbecomeanimportantpartofdataclusteringtheory.Fuzzyc-means(Fuzzyc-means,FCM)algorithmisoneofthemostcommonlyusedfuzzyclusteringtechnology,suchasdatamining,artificialintelligenceandimageprocessing.AlthoughtheFCMalgorithmhas

7、theadvantagesofsimpleness,highefficiency,easytoimplementation,therearestillsomeweaknessesandshortages,forexample,itrequiresapredeterminednumberofclustering,clusteringdividedresultsareinfluencedbythechoiceofinitialclusteringcenters,itiseasytof

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。