欢迎来到天天文库
浏览记录
ID:33186360
大小:1.37 MB
页数:67页
时间:2019-02-21
《基于粗糙集的数据挖掘研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、哈尔滨工程大学硕士学位论文基于粗糙集的数据挖掘研究与应用姓名:朱振玉申请学位级别:硕士专业:计算机应用技术指导教师:杨静20060501哈尔滨工程大学硕士学位论文摘要随着数据库的不断增长,自动从数据库中获取有用的知识成为人们日益迫切的需要。粗糙集理论(RoughSets)就是在这样背景下不断发展起来的一种用于不精确、不确定数据挖掘与处理的新型数学理论。粗糙集理论也凭借其独特的优势而在KDD领域中具有越来越重要的地位。属性约简是粗糙集理论研究的核心问题之一,本文首先介绍了Pawlak粗糙集模型以及决策表、差别矩阵和约简等基本概念,为后面章节中的属性约简算法打下了理论基础。本文把属性重要
2、性作为启发式信息,以核属性为寻求约简的起点,通过对算法中加入启发式信息,减少了搜索空间。对属性约简的基本算法做出了改进,把本来是对差别矩阵进行逻辑运算的计算转化成代数运算,在~定程度上简化了计算,提高了约简效率。在文章的最后利用约简算法对远程教学网站中的课程进行等级评价,实验证明,该算法可以获得令人满意的约简。关键词:数据挖掘;粗糙集;属性约简;差别矩阵哈尔滨工程大学硕士学位论文AbstractDaMMininghasken锄urgentnedbemuseofincrcasingsizeof锄盯cnt‰bases.Rou曲Scttheo彤anewmath锄aticalthcoryfo
3、rminingandprocessingimpreci∞andun∞aamdatah弱got掣eatimprovcm锄tundcfthisbackwood.ROughSctthe棚f),hasalsobecomeamainmethodforKDDduetoitSulliqueadv础geinknOwlcdgcdiscove呼蒯butercdIldi衄isoneofthekeytopicsintheRouOSctthrowfield.融t,mcmodelofR0ughSettheofyofPawlal【is劬砸ucedinthispaperanditsbasicconccptssuch
4、弱decisiontable,discemibilitymatrix,andredudion.11lc∞arcb弱ictheoriesforthela“erchapte砖aboutattributereduc【ion“gofithms.Thesi弘ificanccofanribIIteisused鹅theheuristicinfo姗ation,硒dthecoreau劢utc勰thestartofthc蛔6thm,th哪,thesizeofsearc】晡ngspacccanbyreducedbyaddingheu6sticinfo珊ationt0thealg嘶thm.This蛔fith
5、mconvertsthclo舀coperationtothe姆braicoperation,∞itcansinlplifytheoperation柚denhanccthee伍dencyofseekingtheredudi∞insomeextent.~l舔tinthispaperd够s衄thcsiteofremotei鹪tnlcti∞iscvaluatedbyanribme砖dlldi∞姆fithm,柚dby让alyzing也itiscondudcdthattheal906thmcanobtainbeHerIcductionandcVencangetthcoptimalattfibut
6、ercduction∞metjm懿.Keywords:DataMinin岛RouglISct,AttributeRcducti∞,DiscernjbilityMatrix哈尔滨工程大学学位论文原创性声明本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。有关观点、方法、数据和文献的引用己在文中指出,并与参考文献相对应。除文中已注明引用的内容外,本论文不包含任何其他个人或集体已经公开发表的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者(签字):日期:“年厂月1/日哈尔滨工程大学硕士学位论文第1
7、章绪论如何有效地实现对数据的分析和处理,如何快速地从数据中提取出隐含的知识,长期以来一直是人工智能领域的研究热点。机器学习作为人工智能领域的关键技术之一,己经在专家系统、语言处理、故障诊断和智能控制等众多领域“1获得了长足的进展,并日益体现出其应用价值和发展前景。近年来,随着数据库技术的发展和数据库管理系统的广泛应用,人类获取和处理的数据量急剧增加。在这种背景下,一些新的智能数据处理技术,如数据库知识发现(KDD),数据挖掘(DataMining)等应运而
此文档下载收益归作者所有