欢迎来到天天文库
浏览记录
ID:52341904
大小:257.30 KB
页数:4页
时间:2020-03-26
《一种基于区间数的扩展FCM聚类算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、过程控制化工自动化及仪表,2010,37(8):26—29ControlandInstrumentsinChemicalIndustry一种基于区间数的扩展FCM聚类算法薛联凤1,李为相2(1.南京林业大学信息科学技术学院,南京210037;2.南京工业大学自动化与电气工程学院,南京210009)摘要:在区间值数据的聚类算法中。区间数之间的距离大多仅考虑两区间数的上下界值,其最大缺陷在于所定义的距离不满足视觉合理性。因此,区间值数据的聚类很难用传统的FCM方法。为了解决这个问题,本文引入了一种新的区间数的距离
2、测度,扩展了一种可直接处理特征空间为区间数的聚类问题的FCM聚类算法。通过对比分析表明,该算法更具合理性及有效性。关键词:区问数;聚类算法;距离测度;FCM中图分类号:TP391;N945文献标识码:A文章编号:1000-3932(2010)084)026-041引言尽管数据挖掘技术已经成功应用到很多领域,但是由于客观事物的复杂性和不确定性、人类思维的模糊性以及认知的局限性,在许多自然和社会科学领域中对问题的描述及评判准则通常以不确定区间数的形式描述。如何从大量基于不确定性的区间数据中找出隐藏的知识,仍然是人
3、们研究的主要课题^2
4、。对于基于区间数的信息、知识或决策系统问题,首先要解决的是区间数聚类分析。数据聚类是对于静态数据分析的一门技术,在许多领域受到广泛应用,包括机器学习、数据挖掘、模式识别、图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系中更加短的空间距离等。一般把数据聚类归纳为一种非监督式学习,也可称作非校稿式学习。FCM(fuzzyC—rues.118)聚类算法是最常用的一种聚类分析方法¨卅引。对
5、于区间值数据的聚类很难用传统的FCM方法,为了解决这个问题,不少专家提出了区间值数据的聚类算法。但应用中关于区间数之间的距离大多仅考虑两区间数的上下界值,这类方法的最大缺陷在于所定义的距离不满足视觉合理性。本文在引入一种新的区间数距离度量的基础上,扩展了一种基于区间数的FCM聚类算法。该算法可以直接处理特征空间为区间数的聚类问题,它可应用于模式识别、模糊控制和经济管理等领域需要分类的实际问题。通过对比分析表明,该算法更具合理性及有效性。2区间数的度量定义1:设R为实数域,V口,a∈R,a≤a,称闭区间口=[口
6、,a]={菇l髫ER,口≤石≤五}={髫f髫=(1一A)d+A云,AE[0,1]}为区间数。定义在R中全体区间数集合记为,(R)。区间数表明信息覆盖为区间,但真值唯一。区间数的加、减、乘、除、大小比较等运算法则见文献[11]。如果口=五,那么a=[a,云]=a=五,区间数口即为普通的实数,因而Rc,(尺),所以说区间数是实数的推广。设两区间数a=[o,云],b=[6,b],区间数相等定义为:口=6仁Ⅺ=五=b=b。定义2‘12]:设口=[口,a],b=[6,b]∈,(R),P≥1,x,yE[0,1],口,=(
7、1-x)a+xit,b,=(1一Y)b+y6分别为其真值。将两区间数中每一点的差值考虑进去,定义:d(口,6)=(胍11h—brl,出母)聊={f』:l[(1-x)竺捌一r(1-y)b.+舢蛐)诈(1)为口与b之间的度量。由定义2知d(n,6)≥0;若d(n,6)=0,则有髫=y;d(口,b)=d(b,口);又由Minkowski积分不等式得:d(n,6)=(ffI口,一6,I,dz母)1々=㈨1。1№一c1)+(cl一6,)l,如dyr≤(肌哦-cI},姚)坤+(肌乞一b,I,蛐)竹=d(a,c)+d(C,
8、6)显然d是口与b之间的度量(其中c=[c,云]E,(R),V;∈[0,1],c,=(1一z)c+五为其真值)。收稿日期:2010-06-05(修改稿)第8期薛联凤等.一种基于区间数的扩展FCM聚类算法·27·应用关于区间数之间的距离大多仅考虑两区间数的上下界值,但该类方法的最大缺陷在于所定义的距离不满足视觉合理性。例如考虑口=[一1,3],b=[1,3]与精确数C=[0,0],C在口里而在b外,一般希望C与口的距离小于c与b的距离。应用在文献[13]、文献[14]中距离测度得d。(c,口)=do(C,b)=
9、/10(其中P=2),而使用式(1)中距离测度do(c,口)=√÷
此文档下载收益归作者所有