一种基于模糊聚类的区间值属性约简算法-论文.pdf

一种基于模糊聚类的区间值属性约简算法-论文.pdf

ID:58156195

大小:231.29 KB

页数:5页

时间:2020-04-25

一种基于模糊聚类的区间值属性约简算法-论文.pdf_第1页
一种基于模糊聚类的区间值属性约简算法-论文.pdf_第2页
一种基于模糊聚类的区间值属性约简算法-论文.pdf_第3页
一种基于模糊聚类的区间值属性约简算法-论文.pdf_第4页
一种基于模糊聚类的区间值属性约简算法-论文.pdf_第5页
资源描述:

《一种基于模糊聚类的区间值属性约简算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第27卷第1期模糊系统与数学VoI.27,No.12013年2月FuzzySystemsandMathematicsFeb.,2013文章编号:1001—7402(2013)01—0149—05一种基于模糊聚类的区间值属性约简算法郭庆,刘文军,焦贤发,吴磊(1.合肥工业大学数学学院,安徽合肥230009;2.长沙理工大学数学与计算科学学院,湖南长沙410076)摘要:针对区间值信息系统基于粗糙集理论提出一种新的属性约简算法:首先计算同一属性下对象问的相似度,然后通过合取算子计算出所有属性下对象之间的相似度矩阵,再用模糊聚类中的传递闭包算子得到等价矩阵,将区间值信息系统转化为具有等价关系

2、的信息系统并且进行约简,从而得到核,同时给出了该算法的复杂度。最后通过一个实例表明这种算法的有效性和合理性。关键词:区间值信息系统;模糊聚类;模糊等价关系;传递闭包;可区分矩阵中图分类号:TP18文献标识码:A粗糙集理论是由波兰华沙理工大学Paw

3、ak教授于2O世纪8O年代初提出的一种研究不完整、不确定知识和数据的表达、学习、归纳的理论方法[1]。粗糙集方法研究包含多值属性的对象集合,用上近似集和下近似集对应确定属于给定类的最大的对象集合和可能属于给定类的最小的对象集合。由于粗糙集方法无需提供除数据外的任何先验知识,而且得到的知识是以规则的形式描述的,容易被人理解和应用,近年来关于信息

4、系统属性值的不确定性的属性约简问题受到研究者的广泛关注,并被研究者从多方面进行推广。经典的粗糙集理论是以等价关系为数学基础的,所处理的对象属性为离散值或者是不完备的信息系统。而在现实生活中,连续属性值甚至区间值信息系统是普遍存在的。近些年关于区间值值信息系统的属性约简得到大量研究[2]。模糊聚类技术已被广泛的应用到数据处理中。本文针对区间值信息系统的属性约简,结合模糊聚类算法提出一种新的属性约简算法。该算法首先定义属性值之间的相似度,建立各个属性下的相似度矩阵;其次采用矩阵合取的方式给出属性集的相似度矩阵;然后利用模糊聚类技术将其进行闭包运算得到等价矩阵;在给定以主观水平下对属性值进行

5、聚类,基于粗糙集理论对信息系统进行属性约简。最后通过一个实例表明该算法的有效性与合理性。1预备知识定义1.1_g设T一(,A,V,,)表示一个数据表或信息系统,其中为论域,A表示属性集,—UV。,V。是n的属性值域,。:己,×A—是信息函数,即V口∈A,∈U,f(u,口)∈V,对于B4∈^A,定义B上的不可分辨关系为ind(B)一{()∈U×UIV口∈B,f(u,口):f(u,口));对中子集x及上的不可分辨关系R,分别称集合:U{Y∈U/RIy}与一U{Y∈U/RIyn÷收稿日期:2011-09—12;修订日期:2011-11-29基金项目:国家自然科学基金资助项目(11172086

6、)作者简介:郭庆(1979一),男,安徽霍邱人,合肥工业大学数学学院讲师,研究方向:模糊数学与粗糙集理论;刘文军(1971一),男,湖南邵东人,长沙理工大学数学与计算科学学院副教授,研究方向:模糊数学,粗糙集理论与数据挖掘;焦贤发(1965一),男,安徽安庆人,合肥工业大学教授,研究方向:应用数学与控制理论。15O模糊系统与数学≠}为的R下近似集和上近似集,称d()一}f/fRXl为信息系统的R精度,称()一1~d(x)为粗糙度。若A—CUD,其中D为决策属性,称该数据表为决策表,C和D分别称为条件属性集和决策属性集。定义1.2嘲设T一(u,A,V,厂)表示一个决策表信息系统,其中为论

7、域,A—CUD,VaEC的属性重要性定义为啦㈨()一{,其中PO8(D)一uCX,决策表T一(,A,V,厂)称为相容的若POS(D)一U,否则称为不相容的,定义决策表的相容度为:y—lpnrn、l,显然决策表相容的充要条件为y=1。2区间值信息系统属性约简算法定义2.1设T一(,A,V,厂)表示一数据表或信息系统,其中为论域,A表示属性集,aEA,R表示一等价关系,U/R一{X,X,⋯,x)是根据R对论域u的一个划分,若样本正在属性口下的取值f(a,.aT)是一区间值,称该信息系统为区间值信息系统,本文主要讨论这种信息系统的约简算法。设f(a,)一[,uT],其中d≤,当d一时即是传统

8、的信息系统。定义样本t与z,关于属性a的相似度为f0,[,]N[,;]一一1【card(max{u7,“a,)一min{,d;)),’鼢~其中,card(·)表示区间值的长度。显然若ra:0,则属性值f(a,)与f(a一,)相离,若0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。