欢迎来到天天文库
浏览记录
ID:9369530
大小:455.28 KB
页数:7页
时间:2018-04-29
《一种基于粗糙集理论的分类规则提取算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、万方数据一种基于粗糙集理论的分类规则提取算法施明辉周昌乐(厦门大学人工智能研究所,厦门361005)(厦门大学计算机科学系,厦门361005)E—mail:smh@xmu.edu.cn摘要给出了一组关于分类问题的自足而严密的形式化描述,并运用精确和覆盖两种准则,将类的特征明确划分为充分特征和必要特征。在此基础上,结合“约简”方法和“聚焦”机制,提出了一种新的分类规则提取算法。使用该算法,能从分类信息系统中提取出明确的分类规则。这些规则不仅包含了分类信息系统中类的某些潜在的充分特征和必要特征,而且比传统的归纳法所提取的规则更能反映专家的“聚焦”思维方式
2、。最后给出了运用该算法的示例。关键词知识获取规则提取粗糙集机器学习数据挖掘文章编号1002—8331一(2006)09-4)150—04文献标识码A中图分类号TP301AnAlgorithmforClassificationRlllesExtractionBasedonRoughSetTheorySiftMinghuiZhouChangle(InstituteofArtificialIntelligence,XiamenUniversity,Xiamen361005)(ComputerScienceDepartmentofXiamenUniversi
3、ty,Xiamen361005)Abstract:First,agroupofself-completedandrigorousformaldescriptionsaboutclassificationproblemispresented.Bymeansoftwokindsofcriterion,i。eaccuracyandcoverage,thecharacterizationsofclasshavebeendefinitelydividedintotwoparts,thesufficientonesandthenecessaryones.Onsu
4、chbasis,combiningreductmethodwithfocusingmechanism,anewalgorithmforclassificationrulesextractionisproposed.Usingthisalgorithm,onemayfromclassificationinformationsystemextractcrisprules,whichnotonlyconsistofsomepotentialsufficientandnecessarycharacterizationsofclassesintheclassi
5、ficationinformationsystem,butalsoreflectmoreobviouslyandaccuratelyexperts’thinkingwayoffocusingmechanismthanthetraditionalinductionapproaches.Atlast,anexampleispresentedtoillustratetheproposedalgorithm.Keywords:knowledgeacquisition,rulesextraction,roughset,machinelearning,datam
6、ining1引言知识获取是人工智能领域中的重要研究问题之一,也是数据挖掘的主要目的。从大量的事例中提取出隐藏的且有用的知识是知识获取的重要途径。为了能够从已知的数据库或事例中自动获取知识,已经提出了许多归纳学习方法。例如:基于统计的的方法、神经网络方法、决策树法、决策规则法等【l-31。由波兰Pawlak提出的粗糙集理论(RoughSetTheory,RST)t4·目正日益受到国际学术界的重视[61。Pawlak在1982年提出RST【4】.1991年出版了专著[51。为RST奠定了严密的数学基础。从1992年起,以RST为主题的国际会议每年都召开,
7、推动了RST的拓展与应用。国际上已成立了粗糙集学术研究会。RST已成为人工智能领域中一个较新的学术热点[61。已有2000多篇论文和一些著作对RST相关内容展开论述171。在人工智能和认知科学中,尤其是在机器学习、知识获取、决策分析、知识发现、专家系统、归纳推理和模式识别等领域中,粗糙集方法已经成为基础而重要的方法,并在许多实际问题中得到应用171。近来,RST也被应用于规则归纳法暇91。传统的规则归纳法.例如AQl5t101和PRIMEROSEt“】,不能提取出合理表达专家决策过程的规则嗍。与专家总结的规则相比,它们产生的规则描述的长度太短.也很难
8、令专家从领域知识的观点做出解释嘲。其中一个主要原因是传统的规则归纳法中,规则产生的过程通常仅采用一种准则,如
此文档下载收益归作者所有