基于遗传算法思想的加权模糊C均值聚类分析-论文.pdf

基于遗传算法思想的加权模糊C均值聚类分析-论文.pdf

ID:54924991

大小:518.13 KB

页数:5页

时间:2020-05-04

基于遗传算法思想的加权模糊C均值聚类分析-论文.pdf_第1页
基于遗传算法思想的加权模糊C均值聚类分析-论文.pdf_第2页
基于遗传算法思想的加权模糊C均值聚类分析-论文.pdf_第3页
基于遗传算法思想的加权模糊C均值聚类分析-论文.pdf_第4页
基于遗传算法思想的加权模糊C均值聚类分析-论文.pdf_第5页
资源描述:

《基于遗传算法思想的加权模糊C均值聚类分析-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、研究与开发文章编号:1007—1423(2014)23—0003—05DOI:10.39690.issn.1007—1423.2014.23.001基于遗传算法思想的加权模糊C均值聚类分析吴迪.刘循(1~lJll大学计算机学院,成都610065)摘要:模糊C均值主要考虑距离函数,即点与点之间的关系。在样本集中,不同样本点对于聚类的影响不同,加权模糊C均值通过对点本身加权来体现这一点。(加权)模糊C均值对初始中心敏感,且容易陷人局部最优;而遗传算法则是全局最优。所以,将二者的思想结合,利用遗传算法得到初始聚类中心,再用加权模糊C均值进行分类

2、,可以得到更好的聚类效果关键词:模糊C均值;加权;遗传算法;全局最优;初始聚类中心0引言本空间要被分为m类:{c。,c,⋯,c}。在模糊聚类分析中.每个样本并不被唯一确定地分到某个具体的类中,聚类分析指将物理或抽象对象的集合分组成为由而是记录每一个样本对于每个类的排斥性度量。定义类似的对象组成的多个类的分析过程。聚类分析目前模糊矩阵Um{u},用来表示样本点i对于聚类的广泛应用于数据挖掘、图像处理、电子商务等计算机相排斥性,“的定义如下:关的理论与实践中,以及地理学、生物学、商业等其他“=L(1)领域聚类分析有多种分类标准。按隶属度划分,

3、可以JI辑~cj.1J分为硬聚类和模糊聚类两大种硬聚类的隶属度为离k=l散值.即0或l,前者表示样本点不属于某个类,后者表cj表示第J类的中心,lI一cjll表示兢到q的欧氏距离。则由(1)式可得,毛到Cj的欧式距离越近,则‰示属于;模糊聚类的隶属度的取值范围则是f0,11,用数的值就越小,即对聚类J的排斥性就越低。u满足以值的高低.来衡量某个样本点对于某个聚类的相容度下性质.或排斥度。在很多实际的应用场景中,采用模糊聚类比硬聚类显得更加合理.因为对于很多事物.难以有明确∑uo.=l(2)j=l的标准进行划分,进而也就无法明确确定其界限。

4、当事定义FCM算法的目标函数为:物之间是模糊关系时,就应该采用模糊聚类分析。关于聚类分析及其基本方法的综述.可参考文献∑∑bz(3)』=li=1[1]和[2]。b为模糊指数.一般取大于1[3J。当筏距离cJ越接近1加权模糊C均值算法时,IlXi-~jIl的值越小,u的值也越小。由(3)可知,J的值也越小。FCM算法实质上是求(3)式在条件(2)下的1.1模糊聚类分析和FCM模糊C均值算法条件极值。建立公式:设一共有n个样本,样本空间为X:,,⋯,%}。每一个样本筏共有k个属性,记为F,,⋯,},样现代计算机2o14.08中o研究与开发,,

5、LC^、M——————L———一——一(l1l1),=I2+∑A(∑一1)(4)“:_———=1i=1fII[、_1)∑、{I广cklI∑d相比FCM,WFCM的模糊矩阵M并没有发生改对各个6输~V入参数求导,得到:变.只是聚类中心Ci的选择发生了改变。这实质上是因∑u:瓤为WFCM不仅继承了FCM关注点间距离这一思想.而cJ:上l_(5)且还实现了不同的点本身对分类的不同程度的影响。∑ub由于基于模糊聚类思想的分类对聚类中心敏感.所以WFCM每次得到更合适的聚类中心.以期得到更合理“=-—————一(6)的聚类结果因为WFCM中W不会变

6、化,所以在实验c雠¨)过程中.先计算Wi的值.然后就按照如1.1最后描述的推导过程比较复杂,可参考文献[4],它给出了具体FCM的过程进行计算(注意:cj的计算公式要用(1o)而的推导过程。FCM首先自定义模糊指数b和分类数rn,不是(5))。然后随机给出各个聚类中心c,依据(1)计算初始模糊关于FCM的改进方法还有泛化隶属度、核函数的矩阵。计算(3),然后根据(5)和(6)更新。f和直至.,方法等[6q0]达到收敛条件(理论上为达到最小值并不再改变.但实2基于遗传算法思想的加权模糊C均值算法际操作时,通常是两次相邻.,的变化幅度低于事先

7、设定的阈值,并且保持这个状态)。2.1遗传算法的基本思想遗传算法GA(GeneticAlgorithm)是人类受到自然1.2VC-lZCM加权模糊C均值算法界进化论的启发.把种群中的优异的个体或者个体中传统的FCM算法只是考虑点与聚类中心之间的的部分性质,传递到下一代.这样种群得以优胜劣汰,聚类,即点与点之间的关系。但是,通常不同的样本点不断进化.最终求得满足要求的全局最优解遗传算法对聚类结果的影响程度也不同。即我们不但应该考虑点与点间的关系,而且应该关注样本点本身。这里采用分为编码、初始种群生成、适应度计算、进化操作、终止条件判定等过程

8、。关于遗传算法的综述见于文献『111。现在被经常使用的点密度加权的方法:关于遗传算法每一步的简洁直观的解读见于文献『121。㈩一篇很好的关于遗传算法研究的学术会议论文见文献由(1)可知,距离i

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。