欢迎来到天天文库
浏览记录
ID:45777707
大小:195.31 KB
页数:61页
时间:2019-11-17
《关联规则更新算法研究与应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、关联规则更新算法的研究与应用摘要数据挖掘(或知识发现)出现于20世纪80年代末,冃前已经成为人工智能和数据库等领域的研究热点。它有着广阔的应用前景,并将在新的世纪里在各个领域发挥其强大的生命力。R・Agrawa1等在1993年提出了关联规则问题,现在关联规则已经成为数据挖掘研究的重要方向,并口吸引了众多学者和专家的关注。关联规则挖掘的典型算法是由R.Agrawa1等提出的Apriori算法。Aprio算法在计算侯选项目集的支持度时需要多次扫描整个数据库,而随着K的增大,不仅K维项目集的数目减少了,而且能包含这些项目集
2、的事务也是很少的。由于数据规模大且时常更新,使得采掘效率较低,必须设计更有效的算法。另外,当数据库屮增加新的数据时,现有的多数算法要重新扫描整个大型数据库,而且现有算法中项目集的支持度是基于整个数据库计算的,当新增的数据中出现新项目时,即使包含新项目的项目集频繁地出现,现有算法常把这些项目集作为非频繁项冃集,由此产生的关联规则不能反映最近的商业活动。基于数据挖掘的研究现状和关联规则挖掘算法存在的闯题,本文主要进行了以下的研究工作:(1)数据•挖掘技术的分析与研究。在介绍数据挖掘基本概念的基础上,对数据挖掘与传统分析方
3、法、数据库中的知识发现和联机分析处理做了深入地分析和比较,对数据挖掘的对象、可发现的模式进行了详细地分类、归纳和总结,对数据挖掘常使用的技术做了介绍和分析。(2)关联规则数据挖掘技术的分析与研究。在提出关联规则基本概念的基础上,木文对关联规则的种类进行了全面地分类、归纳和总结,对关联规则的典型挖掘算法及其基本思想进行了详细地归纳、分析和研究,对各算法之问的差别进行了客观地比较。同时,也详细地讨论了提高算法效率的各种优化技术,客观地分析了它们的优缺点和利与弊。(3)针对Apriori算法的不足,提出了一种新的关联规则的
4、高效挖掘算法。新算法根据支持度对事务数据库进行筛选删除操作,使得在计算候选集支持度时,所扫描的事务数据库比原来的事务数据库小,从而提高整个算法的效率:同时,釆用了一种新的产生候选集的算法,该算法避免了原有算法在产生候选集时,对频繁集的多次扫描,提高了效率。(4)作为一-个应用,本文对CRM做了较全面地分析,结合数据仓库知识,探讨了如何把数据挖掘技术及关联规则挖掘应用于CRM中,辅助企业鮫好地管理客户。关键词:数据挖掘:关联规则:频繁项H集:最小频繁概念格:客户关系管理icationofUpA1gorithmResea
5、rchandApp1datingAssociationRulesAbstrcatDataMiningorKnowledgeDiscoveryemergeinginthelatel980shasbecomeahotsp0t•1nthcf•1C1ds0fart•1f•1c•1a1•1ntc11•1genccanddatabasctcchno1ogy♦Datam•1n•1nghas•tswdeapP1•cat•onPr0spectand•seXpectedtoc0nt•nuet0f1our•sh•nthenewmi11en
6、n•1um■RAgrawa1ete•f■1rstPutf0rwardthe■1ssue0fm1ningassc>c•1at■10nru1esin1993•N0w•thasbeenas•gn•fcantc0ntcnt0fdatamin•ngands0drawsmuchattent•0n0fmanyresearchers•ThctyP•1ca1a1g0r•1thm0fass0c•1at•10nru1cisAprior•1that•1sputforwardbyR.Agrawa1•H0weVer9•nca1cu1at•ngt
7、hesupP0rt0fcand•date•temsetsthea1g0r•1thmneedt0scanthewh01edatabases0fc•1rcu1at•10nsAPr•0ri.Butastheincreases0fK9n0t0n1ythenumber0fK——1temsetsreducebuta1s0thethngswhchinc1udethese•1temsetsbec0mefew■BecausedatabeC0me1argerandrenewfrcqucnt1y9•1t1!sratherdff•1cu1t
8、tOod(9!s•1gneffectiVcdatamin•1nga1grithms•Inadd■1t■10nm0st0fthca1g0rthmsmIustscanthcwh01c1argc、databasew1hennewdataareaddedtoit.Moreover,thcitcmsctswhichincludesnewitcrnswi1
此文档下载收益归作者所有