基于属性依赖度分析的粗糙集数据挖掘方法应用

基于属性依赖度分析的粗糙集数据挖掘方法应用

ID:5996561

大小:206.94 KB

页数:5页

时间:2017-12-30

基于属性依赖度分析的粗糙集数据挖掘方法应用_第1页
基于属性依赖度分析的粗糙集数据挖掘方法应用_第2页
基于属性依赖度分析的粗糙集数据挖掘方法应用_第3页
基于属性依赖度分析的粗糙集数据挖掘方法应用_第4页
基于属性依赖度分析的粗糙集数据挖掘方法应用_第5页
资源描述:

《基于属性依赖度分析的粗糙集数据挖掘方法应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、2009年09月沈阳建筑大学学报(自然科学版)Sep.2009第25卷第5期JournalofShenyangJianzhuUniversity(NaturalScience)Vol.25,No.5文章编号:1671-2021(2009)05-1009-05基于属性依赖度分析的粗糙集数据挖掘方法应用12134韩忠华,刘春光,王长涛,国崇珲,廖廷悟(1畅沈阳建筑大学信息与控制工程学院,辽宁沈阳110168;2畅沈阳建筑大学学报编辑部,辽宁沈阳110168;3畅辽宁省机械研究院有限公司,辽宁沈阳110032;4畅中国人民银行海口

2、中心支行,海南海口570105)摘要:目的采用粗糙集中的属性依赖度分析方法对胶合板缺陷检测数据进行分析,获得各属性对决策的不同作用,并得出各属性间的依赖关系.方法采用粗糙集属性依赖度分析方法对实验数据进行有效分析,挖掘出对决策分析影响大的属性,去掉对决策分析影响小的冗余属性,构造数据挖掘模型.结果从胶合板缺陷检测数据中挖掘出各属性对决策分析的影响程度以及各有关属性间依赖关系的知识,在胶合板缺陷检测数据集的17个属性中,得到了3个重要属性,5个对决策影响较小的属性.结论基于粗糙集属性依赖度的数据挖掘方法提高获取规则的快速性,降

3、低计算的复杂度,增强规则的可解释性,取得良好的研究结果.关键词:数据挖掘;粗糙集;属性依赖度;胶合板缺陷检测中图分类号:TP391文献标志码:A于属性依赖度分析的粗糙集数据挖掘方法,通过0引言对各属性依赖度的研究了解到不同属性对决策的随着计算机技术和信息技术的发展,信息的不同作用,获得对决策分析影响大的属性,去掉对增长速度呈指数上升,面对海量数据,如何从中发决策分析影响小的冗余属性.现有价值的信息或知识,成为一项重要和艰巨的1属性依赖度概念任务.数据挖掘作为一种潜在的、功能强大的技术能够帮助用户在海量的、隐含的、事先未知的数

4、据令K=(U,R)为知识库,且P,Q彻R,当k=中找到重要的和有价值的信息,能预测未来趋势γp(Q)=card(posp(Q)/card(U));posp(Q)=和行为,使商务活动具有前瞻性,有助于用户做出∪R(x),x∈U/ind(P)时,称知识Q是k度依赖[1]基于知识的决策.于P的(0≤k≤1),记作P痴kQ.这里card(posp粗糙集理论在处理大数据量,消除冗余信息(Q))表示了根据P,U中所有一定能归入Q的元等方面具有显而易见的优势,因此广泛应用于数素数目.[2-7]据挖掘的数据预处理、属性约简等方面.通常当k=

5、1,称Q是完全依赖于P的;当0<k<在粗糙集决策表中记录了大量实例的属性值情1,称Q是粗糙(部分)依赖于P的;当k=0,称Q况,而每个属性值的重要程度是不一样的,重要性完全独立于P的.高的属性在做决策时起到的作用大.国内外学者上述描述的观点也可解释为对对象分类的能[8-9]仅采用粗糙集方法进行数据去冗,并没有深力.准确地说,当k=1时,则论域的全部元素都可入挖掘粗糙集在数据挖掘过程或缺陷检测中各属通过知识P划入U/Q的初等范畴;当k≠1时,只性之间的依赖关系及各属性对决策的作用.因此,有属于正域的元素可以通过P划入知识Q的范

6、笔者以胶合板缺陷检测为应用对象,提出一种基畴;特别地,当k=0时,论域中没有元素能通过P收稿日期:2008-09-01基金项目:建设部科技攻关项目(2007-K7-27)作者简介:韩忠华(1977—),男,博士研究生,主要从事智能交通、智能控制、数据挖掘和模式识别研究.1010沈阳建筑大学学报(自然科学版)第25卷划入Q的初等范畴.域,故剩余属性的依赖度通过式(1)来计算.由依赖性的定义可见,当P痴kQ,则由Q导k=γp(Q)=card(posp(Q)/card(U)).(1)出的分类U/Q的正域覆盖了知识库的k×100%由

7、式(1)计算得k=0畅3695652.k值越大,元素;另一方面,只有属于分类正域的元素能被唯说明剩余属性之间的依赖度越强,则该属性对决一的分类,即对象的k×100%元素通过知识P划策分析的影响越小.按照上述方法,依次去掉其他入分类U/Q的模块中.属性以求取剩余属性的依赖度,结果如表1所示.系数γp(Q)可以看作Q和P间依赖度的量表1属性依赖度度,换言之,当用集合posp(Q)约束知识库中的对去掉的剩余属性不相容记录象集合时,将得到P痴Q为完全依赖的知识库.属性依赖度b(灰度均值)1160畅36956522属性依赖度分析研究c

8、(灰度中值)1020畅4456522胶合板的缺陷检测是通过对属性的分析和判d(灰度最频值)1060畅423913断实现的,在检测胶合板缺陷类型时,某些属性对e(灰度标准差)1020畅4456522检测具有重要意义.为了找出某些重要属性,需要f(畸变)1060畅423913从决策表中去掉另外

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。