资源描述:
《信息系统的属性约简算法-【中文】ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、信息系统的属性约简算法信息系统的特征选择算法输入算法输出↓↓↓信息系统或决策表约简REDUCT属性约简或降维↓属性子集Preview1.信息系统是一个4元组即No.OutlookTemperatureHumidityWindDecision1SunnyHotHighWeakNo2SunnyHotHighStrongNo3OvercastHotHighWeakYes4RainMildHighWeakYes5RainCoolNormalWeakYes6RainCoolNormalStrongNo7OvercastCoolNorma
2、lStrongYes8SunnyMildHighWeakNo9SunnyCoolNormalWeakYes10RainMildNormalWeakYes11SunnyMildNormalStrongYes12OvercastMildHighStrongYes13OvercastHotNormalWeakYes14RainMildHighStrongNo表1.一个信息系统的例子2.不可分辨关系(等价关系)给定信息系统,,称x和y关于R是不可分辨的,如果例题对表1所示信息系统,若R={Outlook},则样例1,2,8,9,11关
3、于等价关系(或知识)Outlook是不可分辨的,因为它们在属性Outlook上的取值是相同的。类似地,样例3,7,12,13关于Outlook是不可分辨的;样例4,5,6,10,14关于Outlook是不可分辨的。若R={Outlook,Temperature},则样例1,2关于R是不可分辨的;样例3,13是不可分辨的;样例4,10,14是不可分辨的;……3.下近似和上近似给定信息系统,,X关于R的下近似和上近似分别定义为和例题对表1所示信息系统,设R={Outlook},X={1,2,6,8,14},计算X关于R的下近似和上
4、近似。设R={Outlook,Temperature},X={3,4,5,7,9,10,11,12,13},计算X关于R的下近似和上近似。注:用知识R描述决策类的问题负类正类解:(1)根据下近似的公式先计算样例x的R等价类,分别是:U1={1,2,8,9,11};U2={3,7,12,13};U3={4,5,6,10,14}.X={1,2,6,8,14}U1,U2,U3均不包含于X,故X的R下近似为空集。注:说明仅用R来描述X(负类)是不够的解:(1)根据上近似的公式因为U1,U2,U3和X均有非空交集,故X的R上近似为全集(
5、论域)。(2)可类似求解4.Q-P正域给定信息系统,Q的P正域定义为说明:若Q为决策属性子集(一般决策属性是单属性),P为条件属性子集,则Q-P正域描述的是用知识R可以完全描述决策类。例题对表1所示信息系统,设P={Outlook},Q={Decision},计算信息系统的Q-P正域。解:首先求论域关于决策属性Q的划分,得X1={1,2,6,8,14},X2={3,4,5,7,9,10,11,12,13}负类正类下面分别求X1和X2关于P的下近似和。根据下近似的定义得,而从而故这说明对于信息系统U,只要条件属性Outlook的
6、值等于Overcast,则可断定该样例为负类。5.属性集的独立性给定信息系统,如果对于任意的下式成立则称属性p为P中不必要的(或冗余的),否则称p为P中不必要的。如果P中任意属性都是必要的,则称P是独立的。6.属性约简给定信息系统,对任意的,若P'满足如下条件则称P'是P的约简7.属性的核给定信息系统,P中所有必要属性构成的集合称为P的核,记为CORE(P)属性约简算法信息系统的盲目删除属性约简算法基于Pawlak属性重要度的属性约简算法基于Skowron差别矩阵的属性约简算法基于信息熵的属性约简算法属性约简算法分类依据有无启
7、发式1、盲目法2、启发式算法依据属性获取途径1、删除法2、添加法例如:盲目删除属性约简算法例如:基于Pawlak属性重要度的属性约简算法,基于差别矩阵的属性约简算法,基于信息熵的属性约简算法等例如:盲目删除属性约简算法例如:基于属性重要度的属性约简算法,基于信息熵的属性约简算法等我们常用的大多是启发式的添加算法信息系统的盲目删除属性约简算法信息系统的盲目删除属性约简算法思想:从属性全集中逐个删除,直到满足约简条件。基于Pawlak属性重要度的属性约简算法属性重要度度量了属性对信息系统的分类能力基于Pawlak属性重要度的属性约
8、简算法1、构造思想基于Pawlak属性重要度的属性约简算法2、具体步骤基于Pawlak属性重要度的属性约简算法2、具体步骤思想:从核开始逐个添加,直到满足约简条件。核等于差别矩阵中所有简单属性(单个属性)元素的集合。基于Skowron差别矩阵的属性约简算法基于Skowron差