欢迎来到天天文库
浏览记录
ID:25374626
大小:49.50 KB
页数:4页
时间:2018-11-19
《一种基于互信息的规则约简方法论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、一种基于互信息的规则约简方法论文.freel})相对于知识(属性集合)U/ind(X)={X1,X2,…,Xn}的条件熵:H(Y
2、X)定义为:定义7互信息:设T=U,R,V,f是一个决策表系统,其中R=C∪D,C是条件属性集合,D={d}是决策属性集合,且AC,对于任意属性a∈CPA的重要性定义为:SGF(a,A,D)=H(D
3、A)-H(D
4、A∪{a})。若A=Φ,则:SGF(a,A,D)=SGF(a,D)=H(D)-H(D
5、{a}),称为属性a和决策D的互信息,记为I(a,D)。3基于信息熵的规则约简在信息表中,由于应用粗糙集理论提取的规则未
6、必都是最简规则,即规则中可能存在某个属性值是不必要的,因此规则约简。由于在决策表中可以通过添加某个属性所引起互信息的变化大小作为该属性重要性的度量,互信息SGF(a,A,D)值越大,说明在已知A的条件下,属性a对于决策D就越重要。因此,基于论域上的不可分辨关系和信息熵的知识可以对确定性规则约简。其方法如下:Step1:利用互信息公式计算约简中各属性的互信息,将结果值按降序排列。Step2:对约简中每个属性(按互信息降序顺序)依次逐行考察确定性规则集中每条规则,若抽取到的规则与其后的规则产生冲突,则将发生冲突规则的该属性值标记为1,若产生重复记录
7、,则将对应规则中的该属性值标记为3,既不产生冲突也不产生重复的规则的属性值标记为2。Step3:对规则集中的规则进行逐行考察,首先判断是否能由属性值标记为1的属性做出正确决策,若不能将属性值标记为2的属性添加进来,若仍不能得出正确决策,则按互信息的大小依次把属性值标记为3的属性添加进来,直到做出正确决策为止,并将做出正确决策的对应的当前规则保存到新的规则集中。Step4:将规则集中能利用step3得出的当前规则做出正确判断的规则删除。Step5:如此循环直到规则集中规则为空为止,新规则集就是进行规则约简后的最优规则集。4实例分析设论域U={1,
8、2,3,4,5,6,7,8},条件属性集合C={Solarenergy,Volcanicactivity,ResidualCO2},决策属性D为Temperature,决策信息表如表1所示。决策信息表15FactcountSolarenergyVolcanicactivityResidualCO2TemperatureDays1MediumHighLoLoHigh706MediumLoedium)(VolcanicActivity,high)→(Temperature,high)/1;②(SolarEnergy,high)(VolcanicAc
9、tivity,high)→(Temperature,high)/2,5;③(SolarEnergy,high)(VolcanicActivity,loperature,high)/7;④(SolarEnergy,loperature,loperature,loedium)(VolcanicActivity,loperature,high);/3②(SolarEnergy,medium)(VolcanicActivity,loperature,loperature的信息熵约简属性solar,volcanic的互信息:H(D)=-1*(130/27
10、0*log2(130/270)+140/270*log2(140/270))=0.999属性SolarEnergy的条件熵:H(D
11、C1)=-1*(110/270)*(110/110)*log2(110/110)-1*(20/270)*20/20*log2(20/20)-1*(140/270)*(140/140)*log2(140/140)=0属性VolcanicActivity的条件熵:H(D
12、C2)=-1*140/270*(120/140*log2(120/140)+20/140*log2(20/140))-1*130/270*(120/1
13、30log2(120/130)+10/130*log2(10/130))=0.345两属性的互信息为:Gain(SolarEnergy)=0.999Gain(VolcanicActivity)=0.654因为solar互信息大,相对决策重要,Volcanic小,所以先考虑规则中删除Volcanic属性值,当删除Volcanic,若SolarEnergy为high时,规则集合中没有产生冲突规则;若SolarEnergy为loperature,high);(SolarEnergy,loperature,loedium,决策属性d值是high和loe
14、dium,VolcanicActivity值不能删除。由此最终得到的简化规则集:①(SolarEnergy,medium)(VolcanicActiv
此文档下载收益归作者所有