欢迎来到天天文库
浏览记录
ID:33441264
大小:2.12 MB
页数:79页
时间:2019-02-26
《关联规则挖掘算法及其在web挖掘上应用的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、哈尔滨工程大学硕士学位论文关联规则挖掘算法及其在Web挖掘上应用的研究姓名:王永利申请学位级别:硕士专业:计算机软件与理论指导教师:刘杰20030201哈尔滨工程火学硕士学位论文摘要由于应用性的数据的爆炸式增长(如商业分析),及计算机的软硬件技术的发展完备,数据挖掘已经成为近几年来应用最广泛的分析数据的工具。挖掘重要数据仍然需要配合许多其他领域的技术才能得到完善有效的结果,其中包括机器学习,人工智能,统计学原理,数据库系统,数据可视化等。然而目前大多数挖掘关联规则的算法往往必需多次扫描事务数据库才能达到要求的目标,这样重复性的数据库存取动作将会导致过
2、多的执行时间浪费在I/O动作上另外在频繁集生成规则时现有的算法没有考虑到规则的大量冗余,为了解决这个问题本文提出了一个不需要生成候选集同时有效的去除生成规则时产生大量冗余的算法QAIS,来提高关联规则生成的速度,并且在此算法基础上提出了新颖的关联规则增量更新算法AIU,通过应用合成数掘验证了QAIS/AIU算法的有效性,由试验结果来看这个方法确实能更有效且准确地获得事务数据库的关联规则,尤其适合挖掘超大数据库中高支持度下长模式的挖掘。然后论文介绍了关联规则的一种扩展一时间序列模式挖掘方面的算法,给出了Web同志文件挖掘的高效、新颖的改进算法,并用实验
3、验证了此种方法的有效性。论文的最后讨论了关联规则挖掘领域面临的几个问题。关键词:数据挖掘:知识发现;关联规则;增量更新;时间序列模式;Web挖掘哈尔滨工群人学硕士学位论文ABSTRACTDatamininghasbeenbecomingmoreandmorepopularinthepastfewyearsduetOthegrowingdemandsofdatabaseapplicationandtheadvancesincomputertechnology.DataMiningmergesmanyimportantresearchfieldsincl
4、udingmachinelearning,artificialintelligent,statistics,knowledge—basesystemsanddatavisualization,etc.However,currentalgorithmsproposedfordatAminingofassociationrulesrequireseveralpassesovertheanalyzeddatabaseTheI/0overheadinscanningthelargedatabasecanbeextremelyhigh。Anef蠡ciental
5、gorithmQAISiSproposedthatusestheef五cientmethodtoreducedatabaseaccessactivity,andpresentanovelalgorithmAIUbasedonthisalgorithm.itiSfitforminingassociationrulesandincrementalupdating.ItiSespeciallyeffectiveinVLDB,mininglongpatterns,andhighsupport.ThePerformanceofQAIS/AIUiSverifie
6、donthebasisofsyntheticdatajexperimentsshowthattheproposedalgorithmcanmineassociationrulesmoreefficientlybynotgeneratingcandidateitemsetsandreducingtheredundancyol、fi'equentitemsetswhilegeneratingassociationrules.Andthen,aextentofassociationrules—TimeSeriesPatterniSdiscussed,and
7、anefficientimprovedalgorithmofwebminingispresented.ThePerformanceofalgorithmsiSverifledonthebasisofsyntheticdatatoo.Atlast,theproblemsfacedintheminingassociationrulesfieldarediscussedinthepaper.Keywords:DataMining,KDD,AssociationRules,IncrementUpdating,TimeSeriesPattern,WebMini
8、ng+哈尔滨T程大学硕士学位论文1.1知识发现概述第1章绪论近年来由于计算机科学与技术的快速发展,加速了信息
此文档下载收益归作者所有