欢迎来到天天文库
浏览记录
ID:33531745
大小:2.04 MB
页数:69页
时间:2019-02-26
《关联规则的增量式更新和修剪研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要‘在錾塑崖中发现知识(KnowledgeDiscoveryinDatabases,简称KDD),是当前国际人工智能与数据库研究的热点课题。关联规则的发现是其中的一个重要研究方向∥本文围绕关联规则的增量式更新和关联规则的精简进行了一些研究。主要的研究内容包括:·(1)介绍了关联规则的定义和基本的挖掘算法,以及国际上对关联觇则的主要研究方向。(2)设计了一个关联规则的增量式更新算法FIUA。当挖掘关联规则的支持度和可信度发生变化时,该算法充分利用已发现的规则,根据数掂睡直分布的特点,高效地挖掘关联规则。,、(3)分析了关联规则挖掘过程中存在的
2、“稀有项目问题”,介绍了⋯种新的关联规则的挖掘模型一关联规则的多支持度挖掘。孩模型对不同的项{l采取不同的支持度进行挖掘,不仅可以发现包含稀有项目的规则,同时避免产生过多的规则。r一、(4)结合统计学中的z2检验,对发现的关联规则进行修剪和概括,去除了无意义的、冗余的规则:使用户既可以方便地获知规则的整体概况,又可以有选择地查看有关细节。(5)设计并实现了了一个关联规则的挖掘系统。它通过友好的用户¨导界面,使用户方便、快速地完成关联规则的挖掘任务。(与已有的研究相比,本文的特色在于:(1)设计了一个关联规则的增量式更新算法,并将该算法和直接多
3、次运行apriori算法进行了比较,实验证明该算法的高效性和有效性[3】。(2)对关联规则挖掘中产生的多规则问题,分别从挖掘模式和后处,n两个不同的角度进行了研究,即采用多支持度的挖掘模型和采用统计学中z2检验修剪和概括已发现的规则,并对多支持度的挖掘算法做了改进。(3)实现了一个关联规则的挖掘工具,该工具通过改变调节系数,既可以实现多支持度挖掘,又可以实现单支持度挖掘;并且核心的挖掘算法,利用数据垂直分布的特点,通过数据TID列表的直接连接产生频繁项目集,减少了对数据库的扫描次数(只需两次)。提高了算法的效率。、本项目研究得到国家自然科学基
4、金项目(696'vsol6)项目资助.}}荔捱挖插AbstractAtpresent,KnowledgeDiscoveryinDatabases(KDD)isakeytopicinthefieldsofthenationalArtificialIntelligentandDatabaseresearch.MiningassociationrolesiSanimportantbranchindataminingarea.ThisPa口erfocasesontheincrementalupdatingandthepruningofdiscover
5、edassociationrules.Thefollowingisasummaryofthispaper.1)ThisPapel"introducesthedefinitionandthebasealgorithmforminingassociationrules,andreviewsthemainresearchdirectionofit.2)Inthispaper,weputforwardanincrementalupdatingalgorithm(namedF1UA).WhentheparametersSupportandConfide
6、ncechange,algorithmFIUAmakesfulluseofthediscoveredrulesandminesassociationruleswithhighefficiency.31Aimedattheproblemof“rareitem”intheprocedureofminingassociationrules,thispapergivesoutanewmodel~miningassociationruleswithmultipleminimumSUPPortswhichallowstheusertospecifyadi
7、fferentminimumitemsupportforeachitem.ThisnewmodelenablesUStoachieveourobjectiveofproducingrareitemruleswithoutcausingfrequentitemstogeneratetoomanymeaninglessrules.4)ThispaperproposesallapproachtoprunesandsummaIjzesthediscoveredrulesviathechi—squaredtestforcorrelationfromcl
8、assicalstatistics.Thus.notonlytheinsignificantandredundantrulesarepruned,butalsoth
此文档下载收益归作者所有