欢迎来到天天文库
浏览记录
ID:36504063
大小:367.30 KB
页数:46页
时间:2019-05-11
《基于粗集理论的属性约简方法及应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、江苏科技大学硕士学位论文基于粗集理论的属性约简方法及应用研究姓名:佘侃侃申请学位级别:硕士专业:@指导教师:刘同明20050101AbstractTheResearchontheReductionanditsApplicationofRoughSetsABSTRACTRoughsettheoryisamathematicstooltodealwiththeuncertainandinconsistentproblems.Afterdetailedlyresearchingthecharacteristicsofuncertaintyproblemsin
2、thedataminingprocessandcarefullyanalyzingtheadvantagesanddisadvantagesofseveraluncertaintytheories,thedissertationselectsamethodbasedonroughsettheorytosolvetheaboveproblems.Ourmainlyresearchworkisthestudyofattributesreductionbasedonroughset.Themainachievementsincludes:zAccording
3、toPawlakmodel,weanalyzesthepropertiesofindiscernibilityrelation,focusingontwoimportantconcepts:indiscernibilityrelationandpositiveregion,thenproposesannewreductionalgorithm.Ithasbeenprovedtobemoreefficientthanthoseexistingalgorithms.zWealsosuggestaimprovedmodelcalledWVP-Tmodelco
4、mbiningthevariableprecisionmodelandthemodelbasedontolerantrelation.Itprovedtobeconsistentwiththestatisticandcanovercometheshortcomingofclassicalmodel.zOnthebasisoftheeffortsabove,thearchitectureofanIDSSbasedonroughsetattributereduction(RSAR)isdiscussed.Futhermoren,theIDSSsystemi
5、susedtoCRM,whichhasextendedtheapplicationareaofRSAR.Theresearchworkinthedissertationhaspartlysolvedtheproblemsofdiscoveringknowledgefromthedatawhichisuncertainorincomplete,madeitpossiblefortheRSARtechniquetobefurtherappliedtomanagementdecision.KeyWords:roughset,datamining,attrib
6、utesreduction,intelligentdecisionsupportsy-tems,customerrelationshipmanagement-II-第一章绪论第一章绪论1.1数据挖掘与粗集随着计算机的日益普及,信息量也相应剧增。面对如此庞大的数据资源,人们迫切需要一种新的工具来处理大量的、杂乱无章的数据,并从中获取有用的知识。众多学者投入这方面的研究,并取得了一定的成绩,如目前常用的方法:模糊集法、神经网络法、证据理论等。这些方法在对数据处理时常依赖于先验知识的多少,因此专家的知识直接影响着人们获取知识的准确程度。粗集理论的出现,为我们
7、处理不完整、不精确的数据提供了一种很好的建模工具。这种方法的强大优越性在于不需要专家的知识,不需要专门的机构为原有的数据提供更多的解释。我们可以直接从原有知识出发,划分等价类,因此对知识的划分是粗集的出发点。系统的约简也是以划分为基础,求出任意对象间的差别函数,从而得出能够区分所有对象的最小属性集合,最终得出具有同等表达能力的新信息系统。综上所述,基于粗集的数据挖掘技术在信息系统的研究领域中具有非常重要的意义。1.2粗集理论的研究现状粗糙集(RoughSet)理论是波兰数学家Z.Pawlak在1982年提出的一种分析数据的数[1]学理论。该理论在分类的
8、意义下定义了模糊性和不确定性两个概念,是一种处理不确定、不相容数据和不精确问题的新型数学工具。
此文档下载收益归作者所有