关联规则算法及其在个性化网站的应用研究

关联规则算法及其在个性化网站的应用研究

ID:33409949

大小:2.41 MB

页数:63页

时间:2019-02-25

关联规则算法及其在个性化网站的应用研究_第1页
关联规则算法及其在个性化网站的应用研究_第2页
关联规则算法及其在个性化网站的应用研究_第3页
关联规则算法及其在个性化网站的应用研究_第4页
关联规则算法及其在个性化网站的应用研究_第5页
资源描述:

《关联规则算法及其在个性化网站的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、河海大学硕士学位论文关联规则算法及其在个性化网站的应用研究姓名:朱峰申请学位级别:硕士专业:通信与信息系统指导教师:陈慧萍20040601关联规则算法及其在个性化网站的应用研究摘要数据挖掘就是从大量数据中提取和挖掘知识,故又称为数据库知识发现。关联分析发现关联规则是数据挖掘中最活跃的领域。在很多情况下,用户关心的只是关联规则的一个子集,因此科研人员引入了约束关联规则的概念。本文对关联规则和约束关联规则挖掘算法进行了研究和分析,发现基于候选集的约束算法仍有很大的缺陷,主要问题是:1.需要反复扫描数据库2.产生丈量的候选集因此基于候选集的约束算法在挖掘低支持

2、度、长模式的规则时效率低下。本文分析了这些算法,提出了基于H—Mine算法的Con-H—Mine项目约束算法(Constraint.basedHypcr—StructureMining),该算法仅需扫描两遍数据库,并且采用模式增长的方法不产生候选集;采用Con—H-Struct(Constraint—basedHyper-Structure)结构存储数据集合,减少了空间的开销。同时该算法也可以适用于大型数据集,在进行数据集划分时能够有效地进行空间度量。通过以上改进,设计出一个较好的、有效的数据挖掘算法,效率有所提高,优化了关联规则的挖掘。并以此算法为基础

3、设计出一个个性化网站的原型系统并验证了可行性。关键词:数据挖掘,关联规则,项目约束,Con.H.Mine算法,个性化网站关联规则算法及其在个性化网站的应用研究AbstractMiningassociationrulesisanimportantdataminingproblemwhichistofindtheinterested,hiddenandunknownknowledgethatcanbcdiscoveredfromlargedatabase.Inmanycases,theusersjustconcernasubsetofassociationr

4、ules,50theconstraint-basedassociationrulesminingisintroduced.Afteranalyzingandstudyingconstraint·baseddataminingalgorithms,wefoundtherearetwoproblemsexistinginthem:1.Needscandatabasefrequently2.ProducelargecandidatesetsSoit'slowefficiencywhenthealgorithmsareusedtominelowsupportth

5、resholdlong-patterns,TosolvetheseproblemsweintroduceanalgorithmCon-H—Mine(Constraint—basedHyper-StructureMining)whichisbasedonH—Minealgorithmandproducenocandidatesets.OuralgorithmusesCon-H·Struct(Constraint-basedHyper-Structure)tostoretransactionsSOitCanreducethespaceoverhead.AIS

6、OouralgorithmCanbcfitforlargedatabase,itCandividethedatabaseaccurately.Anewgoodandefficientconstraint—basedalgorithmcanbeworkedoutbytheaboveimprovement.Itrealizedonlyprovidingtheinterestedpatternsandimproveassociativemining.Wealsodesignaproto-systemofpersonalizeWebsitewhichusethi

7、snewalgorithm,andvalidateit’sactualize.Keywords:DataMining,AssociationRules,Constraint·basedMining,Con—H—MineAlgorithm,PersonalizeWebⅡ关联规则算法及其在个性化网站的应用研究第一章引言数据挖掘(DM,DataMining)是近几年随着数据库和人工智能发展起来的一门新兴的数据库技术,简单地说,数据挖掘是从大量数据中提取或“挖掘”知识,在大量数据中发现数据模式,对商务决策、知识库等做出贡献。信息技:术特别是数据库技术的发展直接导

8、致了数据挖掘的出现。1.1课题背景20世纪60年代,数据库技术从原始的文件处理演

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。