粗糙集理论方法及其应用课件.ppt

粗糙集理论方法及其应用课件.ppt

ID:57172275

大小:1013.00 KB

页数:37页

时间:2020-08-02

粗糙集理论方法及其应用课件.ppt_第1页
粗糙集理论方法及其应用课件.ppt_第2页
粗糙集理论方法及其应用课件.ppt_第3页
粗糙集理论方法及其应用课件.ppt_第4页
粗糙集理论方法及其应用课件.ppt_第5页
资源描述:

《粗糙集理论方法及其应用课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、粗糙集理论方法及其应用南京航空航天大学:菅利荣内容简要粗糙集产生与发展的时代背景粗糙集的基础理论与方法粗糙集与其它软计算技术的杂合粗糙集理论方法的应用Internet和数据库技术的迅猛发展和广泛应用,数据库中存储的数据量以惊人的速度在增加,庞大的数据量渗透到社会生活和生产的各个领域,例:金融投资:股票指数和价格、利率、银行卡数据及诈骗监测等;卫生保健:存储在医院管理系统中的诊断数据;生产和制造:过程优化和故障检测;远程通讯网络:呼叫模式和故障管理系统;科学领域:天文观测、语音数据及生物数据等。1粗糙集产生与发展的时代背景其结果导致传统的统计技术及数据管理工具不再适用于分析这些

2、巨量的数据集。海量的数据被描述为“丰富的数据,贫乏的知识”。人们需要采用自动化程度更高、效率更高的数据处理方法来处理大量数据,并提供有用的知识。1粗糙集产生与发展的时代背景从金融业到制造业,越来越多的公司正依赖于巨量数据的分析获得竞争优势,知识已成为社会生活和生产的第一推动力。为了帮助人们智能化地分析海量数据,自动地分析一些事例,出现了新一代的技术和工具,这些技术和工具主要用于数据挖掘(Datamining,DM)和知识发现(Knowledgediscoveryindatabase,KDD)领域。KDD指从大型数据库中自动提取知识,目标是发现数据中隐藏的、以前未知的、潜在有用

3、的知识,本质上是在大的数据集合中寻找数据间的规则及普遍模式。数据挖掘的经典案例:啤酒与婴儿尿片问题1粗糙集产生与发展的时代背景数据库数据准备数据清理与选择数据挖掘规则聚类分类可视化有用的知识图1.1KDD的流程1粗糙集产生与发展的时代背景Pawlak于1982年提出的粗糙集理论(Roughsettheory,RST)是一种描述不完整性和不确定性的数学理论粗糙集理论,能有效地分析不精确、不一致、不完整等各种不完备的信息,是关于数据推理的一种强大工具。粗糙集学习算法能够被用于从决策表中获取以IF-THEN形式表示的规则集。粗糙集方法提供了一种从数据库中获取知识的一种有效的方法。2

4、粗糙集理论思想粗糙集概念示意图粗糙集方法是将数据转化为知识的一种规范的方法。将知识视为分类的能力,每一个对象与一些信息相联系,且对象仅能用获得的信息表示。发现分类问题给定属性间的冗余及依赖,具有相同或相似信息的对象不能被识别。2粗糙集理论思想粗糙集理论思想2粗糙集理论思想粗糙集的主要思想粗糙集的主要思想:是基于不可分辨关系,每一个对象与一些信息相联系,且对象仅能用获得的信息表示。具有相同或相似信息的对象不能被识别。论域的不可分辨对象形成了不可分辨对象的聚类,即知识粒度。用于近似的知识将U划分为由条件属性集判断是不可分辨的对象元素集,元素集被视为用于近似的“知识粒度”;被近似的

5、知识将U划分为由决策属性集生成的决策类,在此基础上,用一种知识近似另一种知识。2粗糙集理论思想表1所示的关于全球变暖的一个信息系统,a1—太阳能(Solarenergy),a2—火山活动(Volcanicactivity),a3—二氧化碳含量(ResidualCO2,),d—温度(Temperature)例2.1信息系统设S=(U,A,V,f)为一个信息系统,也称为知识表示系统。其中,U={U1,U2,U3,…,U

6、u

7、}为有限非空集合,称为论域对象空间;A={a1,a2,a3,…,a

8、A

9、}为属性的非空有限集合。若A中的属性又可分为两个不相交的子集,即条件属性集C和决策属性

10、集D,A=C∪D,C∩D=φ,则S也称为决策表。V=∪Va其中a∈A,Va为属性a的值域;f:U×A→V为信息函数,对于a∈A,x∈U,f(x,a)∈Va,它指定了U中每一对象的属性值。2粗糙集理论方法令a∈A,x∈U,f(x,a)∈Va;对于任一子集φ≠P∈A,在U上的不可分辨关系I定义为:I={(x,y)∈U×U:f(x,q)=f(y,q)q∈P}若(x,y)∈I,则称x和y是不可分辨的。2.2不可分辨关系 (Indiscribilityrelation)不可分辨关系是一个等价关系(自反的、对称的、传递的)。包含对象x的等价类记为I(x)。等价类与知识粒度的表达相对应,它

11、是粗糙集主要概念,如近似、依赖及约简等,定义的基础2.2不可分辨关系 (Indiscribilityrelation)2.3粗糙近似集合X的下近似实际上是由那些根据已有知识判断肯定属于X的对象所组成的最大的集合,也称为X的正区,记作pos(X);集合X的负区neg(X)为根据已有知识判断肯定不属于X的对象组成的集合;集合X的上近似由所有与X相交非空的等价类的并集组成,即那些可能属于X的对象组成的最小集合。集合X的边界区bnd(X)为集合X的上近似与下近似之差,如果bnd(X)是空集,则称X关于I是清晰的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。