欢迎来到天天文库
浏览记录
ID:53570492
大小:186.52 KB
页数:4页
时间:2020-04-18
《基于不完备信息系统的Rough Set决策规则提取方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第Z3卷第11期计算机应用Vol.Z3,No.11Z003年11月ComputerApplicationsNov.,Z003文章编号1001-9081Z00311-0006-03基于不完备信息系统的RoughSet决策规则提取方法何明9傅向华9马兆丰(西安交通大学计算机科学与技术系9陕西西安710049)摘要!对象信息的不完备性是从实例中归纳学习的最大障碍G针对不完备的信息9研究了基于不完备信息系统的粗糙集决策规则提取方法9利用分层递减约简算法9通过实例有效地分析和处理了含有缺省数据和不精确数据的信息系统9扩展了粗糙集的应用领域G关键词!Roughset9
2、不完备信息系统9决策规则9数据挖掘9数据库知识发现中图分类号!TP311.13文献标识码!AAnApproachtoExtractingRoughSetDecisionRulesBasedonlmperfectlnformationSystemsEMing,FUXiang-hua,MAZhao-feng(DePartmentofComPterScienceandTechnolog$,XianJiaotongUnizersit$,XianShaanJi710049,China)Abstract:Theincompletenessofinformationab
3、outobectsmaybethegreatestobstacletoperforminginductivelearningfromeXamples.ThispaperfocusesonanapproachtoeXtractingroughsetdecisionrulesbasedonimperfectinformationsystemsWhentheinformationgivenisincomplete.ITeffectivelyanalysesanddealsWithinformationsystemscontainingmissingdataand
4、imprecisedatabyhierarchicalreductionalgorithmWithinstances.TheapproacheXtendsappliedcategorizesofRoughset.Keywords:Roughset;imperfectinformationsystems;decisionrules;datamining;knoWledgediscoveryindatabases得到的信息几乎都不是完全和精确的4近年来基于不完1引言备信息系统的RoughSet决策规则提取方法引起了广泛的关数据库知识发现与数据挖掘KnoWled
5、geDiscoveryin注本文对不完备信息系统的Roughset决策规则的获取进行了研究利用分层递减约简算法7有效地分析和处理了含DatabasesandDataMiningKDD&DM是近年来逐渐兴起的一个应用研究领域KDD是从数据集中识别出有效的新有缺省数据和不精确数据的信息系统扩展了粗糙集的应用颖的潜在有用的以及最终可理解的模式的非平凡过程1领域DM是整个KDD过程的一个步骤是从存放在数据库数据Z基本概念与原理仓库和其它信息库中的大量数据库中挖掘有趣知识的过程RoughSet粗糙集理论是由波兰科学家Z.PaWlak在Z.1不完备信息系统Z一个信息系
6、统可以定义为一个二元组S=UAT其中198Z年提出的处理模糊和不确定性问题的新型数学工具其重要特点之一是不需要预先任何预备的或额外的有关数据1U是对象的非空有限集合信息如统计学中的概率分布模糊集理论中的隶属度或隶属ZAT是属性的非空有限集合函数而是直接从给定问题的描述信息出发根据不同的观察3对于V0eAT存在一个映射fafaU一V0其中点把实例集划分为等价类来确定给定问题的近似域从而发V0称为0的值域每个属性子集A二AT决定了一个不可区现问题的本质特征和内在规律3规则的获取是DM领域分的关系indA中的一个非常重要的研究课题目前有许多基于机器学习indA=
7、J$eU>UV0eA0J=0$模式识别及统计学的规则的获取算法如决策树方法贝叶斯关系indAA二AT构成了U的划分用UindA来方法聚类分析遗传算法神经网络等RoughSet理论为表示DM提供了有效的方法其导出的规则简练且便于存储和使对于一个对象一些属性值可能是缺省的或不精确的用基于RoughSet理论的KDD&DM主要是借助于信息为了表明这种情况通常给定一个区分值即空值nullvalue系统这样一种有效而直观的数据表达方式通常信息系统给这些属性如果至少有一个属性值0eAT使得V含有空0被认为是完备的即属性值没有缺省并且是精确的然而在值则称S为一个不完备
8、信息系统否则它是完备的我们用许多情况下不完备信息系统却是普遍存在的
此文档下载收益归作者所有