欢迎来到天天文库
浏览记录
ID:37409828
大小:364.76 KB
页数:6页
时间:2019-05-23
《基于邻域粗糙集和蚁群优化的属性约简算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第32卷第5期河北科技大学学报Vo1.32,No.52011年1O月JournalofHebeiUniversityofScienceandTechnology0ct.20l1文章编号:1008—1542(2011)05~0403—06基于邻域粗糙集和蚁群优化的属性约简算法张冬雯,王鹏,仇计清(1.河北科技大学理学院,河北石家庄050018;2.河北科技大学信息科学与工程学院,河北石家庄050018)摘要:在分析单一、给定的邻域大小设定方法弊端的基础上,提出了基于属性数据标准差的阈值设定方法,并将蚁群优化算法引入到属性约
2、简中,以属性重要度为启发信息,构造了基于邻域粗糙集和蚁群优化的属性约简算法,使用了4个UCI数据集进行约简。实验结果表明,提出的算法在约简的分类精度和约简中属性个数方面具有更好的性能。关键词:邻域粗糙集;蚁群优化;属性约简;标准差中图分类号:O231文献标志码:AApproachtOfeatureselectionbasedonneighborhoodroughsetandantcolonyoptimizationZHANGDong—wen,WANGPeng,QIUJi—qing(1.CollegeofSciences,
3、HebeiUniversityofScienceandTechnology,ShijiazhuangHebei050018,China;2.CollegeofInforma—tionScienceandEngineering,HebeiUniversityofScienceandTechnology,ShijiazhuangHebei050018,China)Abstract:Thispaperanalysestheweaknessofsettingasingle,specifiedthresholdforthesize
4、ofneighborhood,andthenputsforwardanewneighborhoodsettingmethodbasedonthestandarddeviationoffeaturedata.Thepaperintroducesantcolongopbimization(ACO)intofeatureselectionandproposesanapprovedfeatureselectionalgorithmbasedonNRSandACO,inwhichthefeatureimportanceistake
5、nastheheuristicinformation.InordertOevaluatetheperformanceoftheproposedalgo—rithm,fourdatasetsfromUCIareusedandtheexperimentalresultsshowthattheproposedalgorithmhasabetterperformanceinclassificationaccuracyofreduetandfeaturenumberinreduct.Keywords:neighborhoodrou
6、ghset;antcolonyoptimization;featureselection;standarddeviation属性约简的目的是在不降低预测分类精度的前提下对数据的属性集合进行约简,摒弃冗余的属性,从而降低对数据处理时的时间和空间复杂度[1]。所有的属性约简算法都包括2个重要的部分:评价函数和子集生成器。评价函数是对属性子集的分辨能力的一种量度,它能够对属性子集的预测分类精度进行评估;子集生成器是使用评价函数对属性集合进行约简,得到最优属性子集的过程。作为一个重要的粒度计算工具,粗糙集理论(RST)l_2被广
7、泛应用于属性约简的算法中[a-sJ。然而,粗糙集理论使用等价关系和等价类的概念对整个论域进行划分,这只适用于处理离散型属性的数据。对于现实应用中的大量数据,往往同时存在离散型和连续型2种属性。对于连续型属性,应用粗糙集理论就必须首先对这些属性进行离散化,显然,对连续型属性进行离散化必然会带来数据信息的丢失。文献[61提出了基于邻域的粗糙集(NRS)模型来对连续型属性进行约简的算法。该算法使用邻域关系对论域进行划分,然后使用这种由邻域关系形成的粒子族来对决收稿日期:2010—12-26;修回日期:2011-06—08;责任
8、编辑:张军基金项目:国家自然科学基金资助项目(60874003)作者简介:张冬雯(1964一),女,河北石家庄人,教授,博士,主要从事优化、预测控制方面的研究。404河北科技大学学报策属性进行逼近,从而提出了邻域决策表模型,并基于此模型构造了连续型属性的属性约简算法。作为该模型的一个重要参数,邻域的大小对属性约简的结
此文档下载收益归作者所有