一种新的基于粗糙集的案例特征权值确定方法

一种新的基于粗糙集的案例特征权值确定方法

ID:5338832

大小:273.04 KB

页数:4页

时间:2017-12-08

一种新的基于粗糙集的案例特征权值确定方法_第1页
一种新的基于粗糙集的案例特征权值确定方法_第2页
一种新的基于粗糙集的案例特征权值确定方法_第3页
一种新的基于粗糙集的案例特征权值确定方法_第4页
资源描述:

《一种新的基于粗糙集的案例特征权值确定方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第3O卷第4期两安工业大学学报Vo1.30No.42010年08月JournalofXi’anTechnologicalUniversityAug.2010文章编号:1673—9965(2010)04—402—04一种新的基于粗糙集的案例特征权值确定方法陈虹,毛红保。(1.西安工业大学机电工程学院,西安710032;2.空军工程大学工程学院,西安710038)摘要:为克服传统权值确定方法的主观性和任意性,探讨了粗糙集理论中知识熵的概念及度量方法,分析了案例特征属性的知识熵与权重之间的联系,提出了基于知识熵的案例特

2、征权值确定方法.通过实例验证了运用该方法确定的权值具有更高的可信度.关键词:案例特征;权值;粗糙集;知识熵中图号:TP18文献标志码:A基于案例推理(Case—BasedReasoning,CBR)性分类的影响程度来确定权值,影响越大则权值越因为避开了传统的基于规则的系统在知识获取问大,如果没有影响则权值为0,这样计算的结果使题上的瓶颈而在越来越多的领域里得到了应用.案得最终只有核属性具有权值,而其他属性的权值都例的相似性匹配(案例检索)是CBR的关键,匹配为0;文献[5]在此基础上进行了改进,提出先进行的结果是

3、否准确直接影响到问题的求解效果.而案属』生约简后再进行类似的权值计算,最终结果也是例的相似性匹配是案例特征相似性匹配及特征权约简后的属性才有权值,其他属性权值也为0.因重的综合反映.案例特征的相似性匹配可以根据具为同一个决策表的约简结果并不惟一,因此不同的体的研究问题来确定,相关研究文献也较多,而特约简结果会产生完全不同的权值分配方案,也就造征权值的分配和确定是进行案例匹配的另一项重成了权值分配的不确定性.但实际上约简是找到划要基础性工作,这是因为各个特征在案例中所具有分不变的最小属性集,并不是说其他属性就没有任

4、的地位不同,对案例性质的影响程度和所起作用也何作用.文中基于概率粗糙集模型,以知识熵理论不相同,所以,这些特征需要通过适当的权值配置,为基础给出一种新的案例特征属性权值计算方法.才能在案例匹配时发挥与其性质相适应的作用.1粗糙集传统的案例特征属性定权方法过分依赖于主观判断和经验,有时难以令人信服_1],有必要从客与文中研究问题有关的几个粗糙集相关概念观的事实出发研究一种能够基于客观事实的权重及定理j.确定方法.粗糙集理论自Pawlak提出以后,深受定义1信息系统是系统S一(U,A),其中U世人重视.由于推理过程是

5、完全由数据决定的,所一{“,“,⋯,I}是有限非空集,称为论域或对以更具客观性,这是它与其他不确定推理理论的最象空间,U中的元素称为对象或实例;A一{a,a。,主要区别,也是最重要的优点l2。].因此,应用粗糙⋯,aIAI}也是有限非空集,A中的元素称为属性,集理论确定案例特征属性的权重系数,可以克服传对于每个aC--A,有一个映射f:U—a(己,),且统方法的局限性,使案例相似性匹配更具客观性,n(U)一{n()l∈U},其中口(U)称为属性a的提高匹配精度.值域.论域U、属性集A、值域和映射.厂组成了文献[4

6、]给出了一种基于粗糙集的案例特征属信息系统的四个要素,因此信息系统S也可以表示性权重计算方法,其思路是根据条件属.I生对决策属为S一(U,A,V,厂).*收稿日期:2010—04—20作者简介:陈虹(1979一),女,西安工业大学助教,主要研究方向为CAD/CAM、虚拟制造等.E—mail:66580353@qq.COrl~第4期陈虹等:一种新的基于粗糙集的案例特征权值确定方法403如果A—CUD,CND一,则称信息系统一个等价关系,形成了对案例库的一个划分,即对(己厂,A)为一个决策表,其中C中的属性称为条件应

7、一条知识.该知识的熵可以通过定义4中的公式属性,D中的属性称为决策属性.来计算.权重是对该特征重要性的一种度量,知识定义2不可区分关系是信息系统S一(【,,C熵表示在没有任何先验知识的情况下,仅通过决策UD)上二元等价关系IND(P),其中P为CUD的表中的数据所能提供的该特征的全部知识量.显任意子集,P≠,IND(P)一{(z,)∈己,×U:n(-z)然,如果特征的知识熵越大,它所能提供的信息也:n()对每个a∈P}.就越多,在案例匹配中该特征匹配成功的话对决策由1ND(P)导出的所有等价类的集合记为属性的支持

8、也就越强.因此,可把特征的知识熵作U/IND(P),它构成了的一个划分,称为U的一为其权重的一种测度,知识熵越大则权重也越大.个知识.U/IND(P)可以简记为U/P.根据定理1,属性对论域的划分越细则知识熵越定义3设R为论域u上的等价关系,则称大,直观地理解就是,取值分散的属性比取值相对(U,尺)为近似空间.集中的属性所提供的信息量多,因此其权值也大.定义4设(U,尺)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。