欢迎来到天天文库
浏览记录
ID:33079268
大小:2.45 MB
页数:54页
时间:2019-02-20
《f-粗糙集不确定性的度量及粗糙集算法的优化》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据UNCERTAINTYM哐ASURE口NF.ROUGHSETSANDPERFORMANCETUNINGFORROUGHSETSThesisSubmittedtoZhejiangNormalUniversityinpartialfulfillmentoftherequirementforthedegreeofMasterofScienceinEngineeringbyMinghuaPei(ComputerSoftware&Theory)ThesisSupervisor:AssociateProfessorDayongDengMay15,2013万方数据
2、IIIHJIHIHIIIIIIlllY2665773F.粗糙集不确定性的度量及粗糙集约简算法的优化摘要粗糙集理论是一种行之有效的数学工具,可以处理不精确、含糊和不完整信息。在数据挖掘、机器学习和模式识别等领域,粗糙集理论广泛应用于分类和特征选择(属性约简)。属性约简的方法包括正域、差别矩阵和差别函数、信息熵以及属性重要度等等。本文的第一个要点是F.粗糙集不确定性的度量。F.粗糙集是一种针对信息表簇或决策表簇的新的粗糙集模型。本文利用F一粗糙集模型中上、下近似的思想,定义了不确定性概念漂移的一些度量,包括概念的上、下近似漂移量,概念的上、下近似偶合度等,并初步
3、探讨了它们的性质。本文的第二个要点是属性约简算法的优化。在各式各样的粗糙集约简算法里划分占去了大量时间。同时,比较操作主导了划分过程。早期的采用蛮力运算策略的约简算法,在划分时需要很多时间来执行比较操作。这在约简大型决策表时是不可接受的。本文提出了一种哈希划分的方法,可以高效解决划分问题同时大幅减少比较运算的次数。本文使用哈希划分改善了决策表划分,并且和以往论文中常常采用的基于排序的划分方法做了详尽对比。通过哈希划分,耗时的比较运算明显减少,因而,很多粗糙集算法的运算效率得以提升。实验表明此方法适合于获取正域、决策表核属性、基于正域的Pawlak约简以及基于
4、属性重要度矩阵的并行约简。本文的另一个亮点是对大数据的测试。不少声称测试了大数据的文章仅测试了10万条以下的决策表的表现。本文不仅加入了百万条数据集的测试结果,还人工合成了一张近40000000条数据、总容量为3.2GB的数据表然后进行了约简测试。最后,哈希划分同样可以改善并行约简。并行约简可以获取决策表的近似约简,实验表明加入了哈希划分的新算法优于原有算法的表现。万方数据关键词:F.粗糙集;概念漂移;哈希划分;并行约简;Pawlak约简I】万方数据UNCERTAINTYN正jASUREINF—ROUGHSETSANDPERFORh压ANCETIn嘣GFOR
5、RoUGHSETSABSTRACTRoughsettheoryisalleffectivemathem.aticaltool,dealingwithimprecise,vagueandincompleteinformation.Ithasbeenwidelyusedinclassificationandfeatureselection(i.eattributereducts)indatamining,machinelearningandpatternrecognition.Concretewaystoobtainattributereductsinclude
6、positiveregion,discernibilitymatrixandfunction,informationentropyandattributesignificanceetcThefirstaspectofthispaperisuncertaintymeasureinF—rollghsets.F-roughsetmodelisanewroughsetmodelforafamilyofinformationsystemsanddecisionsystems.Thispaperdefinessomemeasuresofconceptdriftwitht
7、heideaofupperapproximationandlowerapproximationinF·roughsets.Thesemeasuresincludethemeasuresforconceptdriftofupperapproximationandlowerapproximation,thecoincidencedegreesforconceptdriftofupperapproximationandlowerapproximationetc..Moreover,thispaperinvestigatessomepropertiesofthese
8、measuresThesecondaspectoft
此文档下载收益归作者所有