欢迎来到天天文库
浏览记录
ID:35485995
大小:72.04 KB
页数:11页
时间:2019-03-25
《开题报告-模糊聚类算法改进与应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、模糊聚类算法的改进与应用研究1研究的背景及意义1.1聚类研究背景及意义我们正处在一个信息大爆炸的时代,时间数据库、空间数据库、多媒体数据库、工程数据库、统计数据库等面向特殊应用的数据库系统的出现,使得数据库存储的信息量大大增加,此时对于这些大数量、宽涉及面的数据,依靠以往那种由简单汇总、按指定模式分析的方式已无法实现对数据的有效分析处理。数据的丰富带来了对强有力数据分析工具的需求,人们希望有能够提高更高层次的数据分析工具,希望计算机能帮助我们分析数据、理解数据,并能从大量数据中提取知识模式,进而帮助我们
2、做岀决策。正是为了满足这种耍求,越来越多的专家、学者投身到了研究数据、分析数据的浪潮当中,推动了此项研究不断向广度和深度发展。聚类是一种无监督的分类,是在没有任何先验知识的情况下,把事物按照某种相似性度量划分为若干个类,使得类内事物之间尽可能相似,而不同类的事物之间尽可能相异。物以类聚,人以群分,人类认识世界的过程就是在不断区分不同事物,总结相似事物Z间的共同点或相似性的过程。聚类分析是用数学和统计学的方法研究所给事物集合的分类问题。由于研究角度的不同,聚类分析可能出应用于不同的研究领域,如数据挖掘、模
3、式识别、多元统计分析等学科。聚类的研究成果丰富和促进了很多相关领域的应用,对模式识别、图像处理、模糊控制等的发展产生了重耍影响。因此,研究聚类分析具有重大的理论研究价值和现实意义。传统的聚类分析是一种硬划分,它把每个待辨识的对象严格地划分到某类中,具有“非此即彼”的性质,然而在实际的问题处理中,大多数对象并没有严格的属性,它们在性态和类属方面存在着中介性,因此人们提出了软划分,用模糊的方法来处理聚类问题,即现在的FCM聚类算法。模糊聚类引入模糊集理论使用模糊隶属度的概念,来表达一个对彖属于某个类的程度,
4、很好地解决了这个问题。由于模糊聚类能够更客观地描述事实,因而成为聚类分析的主流研究方向。1965年美国自动控制论专家和数学家扎徳教授(L.A.zadeh)提出了模糊集合理论(FuzzysetThcory)[1]□在模糊集合理论中,集合中的元素具有较为灵活的隶属关系,且其在模糊集合中的隶属度可以在(O,1)Z间任意取值。1978年,扎德教授又提出了可能性理论,其理论意义在于它为模糊集理论建立了一个实际应用上的理论框架。伴随着模糊数学理论和可能性理论的形成、发展和深化,RusPini⑵又提岀了模糊划分的概念
5、,随后Dunn又将Ruspini的类内平方谋差和(WGSS)J,推广到模糊聚类的类内加权平方误差和函数L,形成了最初的模糊聚类理论。在模糊聚类中,基于目标函数的方法具有设计简单、解决问题范围广、结果准确率较高等特点,而且可以转化为数学上的极值问题,因此应用广泛,逐渐成为聚类研究的热点。模糊C■均值算法是图像分割中使用最多的方法之一,模糊聚类算法在模式识别、数据挖掘、边缘检测、图像处理、入侵检测、文本聚类、客户分类等领域也都发挥着重要作用。因此研究模糊聚类尤其是基于目标函数的模糊聚类具有重大的现实意义和广
6、阔的应用前景。1.2图像分割的相关背景知识图像分割是指将一副图像分解为若干互不交叠的、有意义的、具有相同性质的区域。好的图像分割应具备以下特征
7、3]:⑴分割出来的各区域对某种性质(灰度、纹理)而言具有相似性,区域内部是联通的且没有过多的小孔;(2)相邻区域对分割所依据的性质有明显的差异;(3)区域边界是明确的。大多数的图像分割算法只满足上述的部分特征,而U实际的图像处理和分析都是面向某种具体应用的。在具体处理时,不同的图像分割方法总是在各种约束条件之间寻找一种合理的平衡。同时,图像的分割性能受诸多因素的
8、影响,包括图像的同质性、空间结构特性、连续性、纹理、内容、物理视觉特性等等。因此,当前图像分割的发展趋势主要有以下几点:(1)多种分割方法的结合;(2)人机交互的分割方法;⑶人工智能技术的应用。2主要聚类方法的分类冃前常见的聚类算法很多,主要的聚类算法可以划分为如下几类[4]:1)划分方法(partitioningmethods):该类方法是在给定N个待聚类的数据对象和已知划分数目k的条件下,将数据划分为k组,其中每组中的元素个数不能少于一个。这类算法的常见步骤为:首先建立一个初始划分,然后采用迭代重定
9、位技术,通过组间移动的方式,使划分逐渐变“好”。好的标准通常是同一分组屮的样本越接近越好,而不同分组中的样本离得越远越好。这类算法的代表算法有:基于距离的聚类(K-MEANS)算法、K中心点(K-MEDOIDS)算法、随机搜索优化(CLARANS)算法等。这类算法的缺点是对初始聚类中心敏感,容易陷入局部最优。2)层次方法(hierarchicalmethods):这种算法把数据对象分解为许多层,每层的数据对彖代表一个聚类结果,最底层的聚类结
此文档下载收益归作者所有