欢迎来到天天文库
浏览记录
ID:33188572
大小:3.53 MB
页数:124页
时间:2019-02-21
《数据库中的关联规则及挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、西南交通大学博士学位论文数据库中的关联规则及挖掘算法研究姓名:李天瑞申请学位级别:博士专业:交通信息工程及控制指导教师:徐扬2001.5.1西南交通大学博士研究生学位论文第1页摘要数据挖掘属当今信息科学领域的前沿研究课题之一,有关的研究和应用极大提高了决策支持的能力。关联规则是其中一个重要的研究方向,有着广泛的应用背景,已引起人们的普遍关注。目前,关联规则及挖掘算法的研究还不完善,主要表现在下述几个方面:关联规则的理论研究远远滞后于其应用的发展;挖掘过程中将生成大量的规则,使得人们难以有效理解和利用
2、这些知识;关联规则中的所有项目集被同等对待和用唯一的最小支持度来作为衡量的标准,不符合实际需要;在挖掘过程中用户难以参与;如何利用已有的知识来进行知识更新这个问题没有得到很好解决。本文针对上述几方面进行较深入的研究。『主要的工作有以下四个方面:1.在对关联规则挖掘问题研究和总结的基础上,对现有的关联规则挖掘算法进行了分类,深入地分析和探讨了一些典型的关联规则挖掘算法。接着讨论关联规则中项目集与数学中的格、不动点以及概念格之间的联系,证明所有闭项目集的集合构成一个完备格。并指出闭项目集不仅是关联关系中
3、一个概念的内涵,也是关联关系中一个伽罗瓦闭算子的不动点。同时证明伽罗瓦闭算子的所有不动点的集合就是事务数据库中的所有闭项目集的集合。这些研究结果为关联规则的理论研究奠定了良好的基础。2.提出了项目集的上、下闭集以及广义关联规则基的概念,得到了若干性质。借助于这些性质,说明广义关联规则基包含了数据库中所有关联规则的信息以及从所有关联规则集中导出广义关联规则基的方法。同时提出一种直接从数据库中导出广义关联规则基的算法,提高了规则的生成效率。还对广义关联规则基的不足进行分析,同时给出一种挖掘频繁闭项目集的
4、所有下闭集的算法。另外,也对关联规则挖掘问题中常用的兴趣度量进行研究,得到一些结果。并提出一种新的兴趣度量,它具有很好的性质,能用来对规则进行排序,以挖掘出感兴趣的规则。这些研究结果在一定程度上解决了关联规则挖掘问题中产生大量规则这个问题。3.通过引入项目集的兴趣度函数(p,提出一种新的关联规则挖掘推广问题一一(p一关联规则挖掘问题,弥补了经典关联规则挖掘问题中存在的项目集被同等对待和用唯一的最小支持度作为衡量标准的不足。并基于FP—tree,提出一种通用的挖掘平.频繁闭项目算法。对于一类特殊的币,
5、提出一种改进第1I页⋯一..亘查茎堕奎兰竺窒竺苎主笙塞__-_-_-____●--ll-__-__--______●_-______-—————————————一一。——的算法。另外,对于算法中的不足,提出一个分而治之的解决方法。并说明给出的算法是可并行化的,同时给出一个并行处理的框架过程。而且,通过(p的给定,使得用户在一定程度上能参与到挖掘过程中,提高了挖掘的效率。4.针对属性集的变化.提出一种增量式更新对象集的上、下近似方法,实现了多个属性同时增加与删除时的增量式更新。在此基础上,提出一种从、
6、数据中挖掘分类规则的伪增量式算法,能够更有效地支持知识更新的需要。7关键词数据库;数据挖掘;关联规则;粗糙集;兴趣度量AbstractDataminingcurrentlyistheresearchfrontierwithintheinformationsciencefield.Therelatedresearchesandapplicationshavegreatlyimprovedtheabilityfordecisionsupporting.Associationrule,whichhasbr
7、oadapplications,isoneofimportantresearchareasindatamining.Atpresenttheresearchonassociationruleandminingalgorithmarestillfarfromperfect.ThatCanbeseeninseveralaspectsasfollows:Researchonthetheoryofassociationrulesignificantlylagsbehindthedevelopmentofit
8、sapplications;Thegenerationofjill!onrulesintheminingprocessmakespeoplehardtounderstandandusethemeffectively;Thatallitemsetsaretreatedcoordinatelyandusingoneandonlyminimumsupportasameasurestandardarenotaccordwiththeneedofpractice;Theuser
此文档下载收益归作者所有