欢迎来到天天文库
浏览记录
ID:32012425
大小:1.24 MB
页数:65页
时间:2019-01-30
《粗糙集理论中连续属性离散化方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、粗糙集理论中的连续属性离散化方法研究StudyonthemethodofcontinuousattributesdiscretizationintheRoughSetTheory姓名王伟学科专业应用数学研究方向计算机应用指导教师吴涛副教授完成时间2008年5月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志
2、对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:签字日期:年月日学位论文版权使用授权书本学位论文作者完全了解有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:导师签名:签字日期:年月日签字日期:年月日学位论文作者毕业去向:工作单位:电话:通讯地址:邮编
3、:II摘要粗糙集理论是波兰数学家Z.Pawlak于1982年提出的一种数据分析理论,它善于从数据中获取知识,并能利用不确定,不完整的经验知识进行推理,能够有效地表达不确定或不精确的知识,而且其无需提供除问题所需处理的数据之外的任何先验信息,完全由数据本身出发来解决问题,这些优点极大的推动了粗糙集理论的发展。然而可惜的是粗糙集理论只能对离散的数据进行处理和分析,这大大限制了粗糙集应用的范围,也是粗糙集理论的瓶颈。在现实中,大部分数据库都含有连续数据,如果要使用粗糙集对数据进行分析处理,就必须对连续属性进行离
4、散化,而且离散化的好坏也直接影响后面的分析和规则提取,这就对连续属性离散化提出了更高的要求。本文主要工作有:(1)首先叙述了离散化概念的来源,以及离散化在数据挖掘和知识发现中的必要性。然后介绍了粗糙集基本理论和粗糙集中的离散化问题。(2)从离散化问题出现到现在,人们提出了各种离散化方法,文中总结了离散化方法的分类、评价标准和发展现状等,并分析了几种代表性的离散化方法。(3)从模糊集理论角度出发,把离散化的选择断点问题看成是找等价关系R将论域U进行划分问题,从而将断点选择对应于寻找合适的等价关系。基于此,文
5、中提出了一种基于模糊聚类的离散化方法,即构造各样本间的模糊相似矩阵,以截关系将其聚类,并在聚类过程中给出选择函数,由该函数在众多不同的聚类结果中选择最优结果,避免了主观因素的影响。(4)分析了在实验过程产生过度聚类的原因,并给出了改进算法,即首先由模糊聚类对样本进行初始聚类,得出类数,并对聚类结果进行平滑处理,找到被过度聚类的类,然后由K-means聚类法根据初始得到的类数,对被过度聚类的类重新聚类。对一些实验进行了比较,得到比较理想的结果。(5)将算法应用于安徽省经济分析中,由该算法离散后的决策表所得到
6、的结果与现实基本吻合。关键词:粗糙集,模糊集,模糊聚类,离散化,连续属性IAbstractRoughSetTheoryisproposedbyPolishmathematicianZ.Pawlakin1982,itcaneffectivelyexpressuncertainandimpreciseknowledge.ThemaindifferencebetweentheRoughsettheoryandotheruncertaintytheoriesisthattheRoughsettheorydoesn
7、otneedanypreliminaryinformationaboutdata.Therefore,ithasbeenapowerfultoolofdataanalysisandpromotedthedevelopmentoftheroughsettheory.Forthemostofthetheorycanonlydealwiththediscretedata,thisgreatlyrestrictedtheapplicationofroughsets.Mostofthedatabasecontain
8、snotonlydiscretedatabutalsocontinuousdatainreality;itisnecessarytodiscretecontinuousattributesbeforeweusetheroughsettheorytoanalysisthedata.Furthermore,thequalityofthediscretizationhasadirectimpactondataanalysisandp
此文档下载收益归作者所有