资源描述:
《基于容错改进的邻域粗糙集属性约简算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于容错改进的邻域粗糙集属性约简算法作者彭潇然,刘遵仁,纪俊机构青岛大学数据科学与软件工程学院;青岛大学计算机科学技术学院发表期刊《计算机应用研究》预排期卷2018年第35卷第8期访问地址http://www.arocmag.com/article/02-2018-08-021.html发布日期2017-07-2111:42:01引用格式彭潇然,刘遵仁,纪俊.基于容错改进的邻域粗糙集属性约简算法[J/OL].[2017-07-21].http://www.arocmag.com/article/02-2
2、018-08-021.html.摘要作为Pawlak粗糙集的扩展,邻域粗糙集能有效地处理数值型的数据。但是,因为沿用了Pawlak粗糙集在构造上下近似集时的包含关系,邻域粗糙集对噪声数据的容错性很差。针对这个问题,通过引入贝叶斯最小风险决策规则,提出了一种基于容错改进的邻域粗糙集属性算法。通过和现有的算法进行比较,实验结果表明,在数据预处理阶段用该算法能得到更好的属性约简。关键词粗糙集,邻域粗糙集,决策粗糙集,属性约简,容错性中图分类号TP301.6基金项目国家自然科学基金资助项目(61503208)优
3、先出版计算机应用研究第35卷基于容错改进的邻域粗糙集属性约简算法*彭潇然a,刘遵仁b,纪俊b(青岛大学a.数据科学与软件工程学院;b.计算机科学技术学院,山东青岛266071)摘要:作为Pawlak粗糙集的扩展,邻域粗糙集能有效地处理数值型的数据。但是,因为沿用了Pawlak粗糙集在构造上下近似集时的包含关系,邻域粗糙集对噪声数据的容错性很差。针对这个问题,通过引入贝叶斯最小风险决策规则,提出了一种基于容错改进的邻域粗糙集属性算法。通过和现有的算法进行比较,实验结果表明,在数据预处理阶段用该算法能得到更
4、好的属性约简。关键词:粗糙集;邻域粗糙集;决策粗糙集;属性约简;容错性中图分类号:TP301.6Attributereductionalgorithmbasedonfault-toleranceimprovementofneighborhoodroughsetPengXiaorana,LiuZunrenb,JiJunb(a.CollegeofDataScience&SoftwareEngineering,b.CollegeofComputerScience&Technology,QingdaoUnive
5、rsity,QingdaoShandong266071,China)Abstract:AstheextensionofPawlakroughset,neighborhoodroughsetcaneffectivelydealwithnumericaldata.However,itsfaulttoleranceisverypoortonoisedata,becauseitfollowstheinclusionrelationwhichisusedforconstructingtheupperandlowe
6、rapproximationsinPawlakroughset.Inordertosolvethisproblem,thispaperpresentsanewalgorithmbasedonfault-toleranceimprovementofneighborhoodroughsetbyintroducingtheBayesdecisionwithminimumrisk.Comparedwiththeexistingalgorithm,theexperimentalresultsshowthatthe
7、attributereductionobtainedbythisproposedalgorithmisbetterinthedatapre-processing.KeyWords:roughset;neighborhoodroughset;decisionroughset;attributereduction;faulttolerancePawlak粗糙集的基础上提出了多种概率粗糙集模型,例如0.5-0引言概率粗糙集模型[7]、变精度粗糙集模型[8]、贝叶斯粗糙集模型[9-10]粗糙集理论认为知识是有粒
8、度的,它是一种对论域中对象等。其中,决策粗糙集模型(Decision-TheoreticRoughSet,进行分类的能力。经典的Pawlak粗糙集[1]引入等价关系将论域DTRS)[11-12]引入了最小风险决策规则,在处理实际问题时具有划分为多个等价类(信息粒),然后根据等价类与决策类之间更好的容错性,因而得到了广泛的关注和研究。但是,决策粗的包含关系提出了上下近似的概念。通过运用上下近似的概念,糙集沿用了Pawlak粗糙集在进行知识划分