欢迎来到天天文库
浏览记录
ID:34811042
大小:2.62 MB
页数:60页
时间:2019-03-11
《试析关联规则挖掘算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、新疆农业大学硕士学位论文关联规则挖掘算法的研究姓名:朱庆申请学位级别:硕士专业:农业机械化工程指导教师:恰汗·合孜尔2010-06关联规则挖掘算法的研究摘要数据挖掘是致力于数据分析和理解,发现数据内部隐藏知识的技术。关联规则挖掘作为数据挖掘领域的一个重要研究分支,其主要目标就是发现数据库中项目之间相关联系。近年来,关联规则挖掘己经成为数据挖掘技术中的一个研究热点,其成果被广泛应用于市场营销、商业决策、政务管理等领域。在关联规则挖掘的研究中挖掘算法的研究是重点,迄今为止已提出了许多高效的关联规则挖掘算法。在关联规则挖掘技术的研究中,一方面挖掘处理
2、的对象是大量数据集,算法的效率对其应用存在着瓶颈;另一方面目前的计算机系统在其性能上不能满足对大量数据集进行处理的要求。因此,我们必须研究和改进现有的算法,使其具有更广泛的应用空间。本文着重对关联规则挖掘算法进行了研究。论文首先对数据挖掘技术作了介绍,其中包括数据挖掘的基本理论、数据挖掘的功能、以及数据挖掘的应用和目前数据挖掘技术面临的一些问题。然后,在此基础上对关联规则挖掘Apriori算法做了深入研究和分析,并结合具体实例阐述了Apriori算法的执行过程,指出Apriori算法存在的不足和局限,另外还给出了其他学者对Apriori算法的改
3、进技术。针对传统的频繁项集挖掘算法中存在着产生大量候选项集、多次搜索数据库查找候选项集支持度等问题,本文提出了基于有向关联图的频繁项集挖掘算法,该算法的基本思想是基于二进制编码技术将原始数据库中的信息储存在有向关联图中,通过对有向关联图的深度优先搜索找出数据库中所有的频繁项集。算法在执行中只扫描数据库一次,减少了I/O操作,同时结合实例对该算法的执行过程进行了详细阐述,并给出了基于有向关联图算法的时间和空间复杂度。最后,在使用VisualC++编程语言实现算法的基础上,采用三组数据集进行实验测试,并对测试结果进行了分析。关键词:数据挖掘;关联规
4、则;Apriori算法;频繁项集;有向关联图ITheResearchontheAlgorithmsofMiningAssociationRulesAbstractDataminingisdedicatedtodataanalysisandunderstandingofthedatawhichcanfindhiddenwithinthedateknowledge.Dataminingassociationruleminingasanimportantareaofresearchbranch,whosemaingoalistofindasetofd
5、atabaseobjectsassociatedwithsomeinterestingorrelatedlinks.Inrecentyears,associationruleminingdataminingtechnologyhasbecomeahotresearchtopicinitsresultsarewidelyusedinmarketing,businessdecisions,administrativemanagement.Inthestudyofminingassociationrulesminingalgorithmisthefo
6、cussofarhasmademanyhighlyefficientalgorithmforminingassociationrules.Inassociationruleminingstudy,ontheonehand,andtaphandlelargeamountsofdataobjectisset,theefficiencyofthealgorithmtherearebottlenecksinitsapplication;ontheotherhand,thecurrentcomputersystemcannotmeetitsperform
7、ancealargenumberofdatasetsprocessing.Therefore,wemuststudyandimproveexistingalgorithms,ithasabroaderapplicationofspace.Thepaperfocusesonassociationruleminingalgorithmsarestudied.Paperintroducesdataminingtechnologies,includingthebasictheoryofdatamining,dataminingfunctionsanda
8、pplicationofdatamininganddataminingtechnologycurrentlyfacingsomeproblems.Th
此文档下载收益归作者所有