关联规则的增量式更新和修剪研究

关联规则的增量式更新和修剪研究

ID:33531745

大小:2.04 MB

页数:69页

时间:2019-02-26

关联规则的增量式更新和修剪研究_第1页
关联规则的增量式更新和修剪研究_第2页
关联规则的增量式更新和修剪研究_第3页
关联规则的增量式更新和修剪研究_第4页
关联规则的增量式更新和修剪研究_第5页
资源描述:

《关联规则的增量式更新和修剪研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要‘在錾塑崖中发现知识(KnowledgeDiscoveryinDatabases,简称KDD),是当前国际人工智能与数据库研究的热点课题。关联规则的发现是其中的一个重要研究方向∥本文围绕关联规则的增量式更新和关联规则的精简进行了一些研究。主要的研究内容包括:·(1)介绍了关联规则的定义和基本的挖掘算法,以及国际上对关联觇则的主要研究方向。(2)设计了一个关联规则的增量式更新算法FIUA。当挖掘关联规则的支持度和可信度发生变化时,该算法充分利用已发现的规则,根据数掂睡直分布的特点,高效地挖掘关联规则。,、(3)分析了关联规则挖掘过程中存在的

2、“稀有项目问题”,介绍了⋯种新的关联规则的挖掘模型一关联规则的多支持度挖掘。孩模型对不同的项{l采取不同的支持度进行挖掘,不仅可以发现包含稀有项目的规则,同时避免产生过多的规则。r一、(4)结合统计学中的z2检验,对发现的关联规则进行修剪和概括,去除了无意义的、冗余的规则:使用户既可以方便地获知规则的整体概况,又可以有选择地查看有关细节。(5)设计并实现了了一个关联规则的挖掘系统。它通过友好的用户¨导界面,使用户方便、快速地完成关联规则的挖掘任务。(与已有的研究相比,本文的特色在于:(1)设计了一个关联规则的增量式更新算法,并将该算法和直接多

3、次运行apriori算法进行了比较,实验证明该算法的高效性和有效性[3】。(2)对关联规则挖掘中产生的多规则问题,分别从挖掘模式和后处,n两个不同的角度进行了研究,即采用多支持度的挖掘模型和采用统计学中z2检验修剪和概括已发现的规则,并对多支持度的挖掘算法做了改进。(3)实现了一个关联规则的挖掘工具,该工具通过改变调节系数,既可以实现多支持度挖掘,又可以实现单支持度挖掘;并且核心的挖掘算法,利用数据垂直分布的特点,通过数据TID列表的直接连接产生频繁项目集,减少了对数据库的扫描次数(只需两次)。提高了算法的效率。、本项目研究得到国家自然科学基

4、金项目(696'vsol6)项目资助.}}荔捱挖插AbstractAtpresent,KnowledgeDiscoveryinDatabases(KDD)isakeytopicinthefieldsofthenationalArtificialIntelligentandDatabaseresearch.MiningassociationrolesiSanimportantbranchindataminingarea.ThisPa口erfocasesontheincrementalupdatingandthepruningofdiscover

5、edassociationrules.Thefollowingisasummaryofthispaper.1)ThisPapel"introducesthedefinitionandthebasealgorithmforminingassociationrules,andreviewsthemainresearchdirectionofit.2)Inthispaper,weputforwardanincrementalupdatingalgorithm(namedF1UA).WhentheparametersSupportandConfide

6、ncechange,algorithmFIUAmakesfulluseofthediscoveredrulesandminesassociationruleswithhighefficiency.31Aimedattheproblemof“rareitem”intheprocedureofminingassociationrules,thispapergivesoutanewmodel~miningassociationruleswithmultipleminimumSUPPortswhichallowstheusertospecifyadi

7、fferentminimumitemsupportforeachitem.ThisnewmodelenablesUStoachieveourobjectiveofproducingrareitemruleswithoutcausingfrequentitemstogeneratetoomanymeaninglessrules.4)ThispaperproposesallapproachtoprunesandsummaIjzesthediscoveredrulesviathechi—squaredtestforcorrelationfromcl

8、assicalstatistics.Thus.notonlytheinsignificantandredundantrulesarepruned,butalsoth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。