欢迎来到天天文库
浏览记录
ID:33191288
大小:2.09 MB
页数:61页
时间:2019-02-21
《一种改进的粗糙集方法在数据挖掘中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、长春理工大学硕士学位论文一种改进的粗糙集方法在数据挖掘中的应用姓名:王明娜申请学位级别:硕士专业:计算机应用技术指导教师:崔广才20031201摘要粗糙集(Roughsets)理论是由Z.Paw]ak教授于20世纪80年代初提出的一种用于处理不确定性和含糊性知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规月4。它无需提供相关数据集合以外的任何先验信息,适合于发现数据库中隐舍的、潜在有用的规律,即知识,找出其内部数据的关联关系和特征。近年来,粗糙集理论和应用取得了很大的成功,
2、已成为软计算方法的重要分支,其涉及的领域包括模式识别、机器学习、决蓑分析和决策支持、知识获取、知识发现等。本文主要研究一种改进的粗糙集方法在数据挖掘中的应用。文中对粗糙集理论进行了研究,在分析和综合基于粗糙集理论的数据挖掘算法基础上,提出了三种新的属性约简方法。首先在粗糙集理论的基础上构造出了相对差异比较表,然后把它与启发性知识相结合分别设计了基于相对差异比较表的改进的属性约简算法、属性约简的判定算法,和提取规则的值约简算法。最后将该算法应用于Cleveland心脏病诊断决策表的约简。实例分析表明,文章提供的算
3、法能够以较大的概率和较高的效率获得较优的属性约简,具有良好的效果。关键词:数据挖掘粗糙集属性约简规则提取ABSTRACTRoughsettheory,initializedbyProfessorZ.Pawlakinearly1980’S.hasbeenprovedtobeanexcellentmathematicaltooldealingwithuncertainandvaguedescriptionofobjects,whosebasicideaistoderiveclassificationrulesofc
4、onceptionbyknowledgereductionwiththeabilityofclassificationunchanged.Itmayfindthehidingandpotentialrules,thatisknowledge,fromthedatawithoutanypreliminaryoradditionalinformation.Inrecentyears.asallimportantpartofsoftcomputing,rou曲settheoryanditsapplicationsha
5、veplayedanimportantrole,especiallyintheareasofpatternrecognition.machinelearning,decisionanalysis,knowledgediscoveryandknowledgeacquisitionetc.Thispaperresearchestheapplicationofanimprovedroughsetmethodindatamining.InthisPa口er,roughsettheoryhasbeendiscussed.
6、Byanalysisandsynthesisofdataminingalgorithmsbasedonroughsettheory,threenewkindsofattributesreductionalgorithmshavebeenpresented.Firstly,weconstructedarelativedifferencecomparisontablebasedontheroughsettheorytoeffectivelyandefficientlyachievethebetterattribut
7、ereduction.ThentherelativedifferencecomparisontableiScombinedwiththeheuristicknowledgetodesignthreealgorithmsrespectively:theimprovedalgorithmforattributereduction,theiudgealgorithmofattributereduction,andS01TIeimprovementsforawidelyusedvaluereductionmethoda
8、realSOachievedinthisPaDeLFinallythenewmethodsareusedtoreducetheClevelandHeartDiseaseDatabasefromtheUCIrepositoryofMachineLearningDatabasesTheexperimentresultsshowthatthenewmethodscallobtainthebe
此文档下载收益归作者所有