数据库中的快速关联规则挖掘

数据库中的快速关联规则挖掘

ID:36545092

大小:1.99 MB

页数:80页

时间:2019-05-11

数据库中的快速关联规则挖掘_第1页
数据库中的快速关联规则挖掘_第2页
数据库中的快速关联规则挖掘_第3页
数据库中的快速关联规则挖掘_第4页
数据库中的快速关联规则挖掘_第5页
资源描述:

《数据库中的快速关联规则挖掘》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、华中科技大学博士学位论文数据库中的快速关联规则挖掘姓名:赵栋申请学位级别:博士专业:计算机软件与理论指导教师:卢炎生20031109挖掘带否定的关联规则是个非常困难的问题,其中主要的计算量来源于要找出所有的频繁广义项日集(项目集中可能带负项目)及其支持度。针对这个问题提出了一个方法,不是去挖掘完整的频繁,一义项目集集合,而是挖掘一个叫做S-free项目集的精简集。使用这个精简集能不用读取数据库就能还原出所有的频繁广义项目集及其支持度。针对挖掘S-free项目集提出了算法MSF.I。我们将它}iApr

2、iori算法做了比较,实验数据显示这种方法更有效。在现代计算机系统中入侵检测系统已经变成了一个很重要的组成部分。入侵检测系统首先使用数据挖掘算法来对审计数据查找频繁模式,析取特征,然后使用分类算法建立入侵检测模型。这其中最重要的步骤是判别字段间的关联和相关性以构造特征。提出了一种新的想法足在入侵检测系统中标准关联规则的描述能力不够,应该使用带否定和带支持度约束的关联规则来取得更好的效果。关键词:数据挖掘;关联规则;频繁项目集;精简集AbstractKnowledgediscoveryindataba

3、se(KDD)hasreceivedincreasingattentionandhasbeenrecognizedasapromisingfieldofdatabaseresearch.Itisdefinedasthenon-trivialprocessofidentifyingvalid,novel,potentiallyusefulandultimatelyunderstandablepatternsindata.Miningassociationrulesfromlargedatabasesp

4、laysartessentialroleinmanydataminingtasksandhasbroadapplications.High—performancescalablecomputingiscrucialforensuringsystemscalabilityandinteractivityasdatasetsgrowinexorablyinsizeandcomplexityTheassociationruleminingalgorithmuselattice—theoreticcombi

5、natorialpropertiestOdecomposetheoriginalproblemintosmallindependentsub—problems.ThemostfamousandinfluentialalgorithmsareApriorimadFP-growth.Whenallmaximalfrequentitemsetsareshort,thesealgorithmsperformreasonablywell.However,performancedrasticallydecrea

6、seswhenanyofthemaximalitemsetsbecomeslonger.111dataminingapplicationswhereitemsarecorrelated,maximalfrequentitemsetscouldbelongAlgorithmSegFreeisproposedtodealwiththisproblem.SegFreedividethedatabaseintosegmentsandextractfleesetsineachsegment.Freesetsi

7、sacondensedrepresentationandtherewillbelessfreesetsineachsegmentifwedividethedatabaseintomoresegments.SegFreesignificantlyreducesthetimeforpatternmatchandismoreefficientthanthepreviousalgorithms.Rule—freesetsisproposedasanotherwaytominedatabaseswithlon

8、gpatternsefficiently.Rule-freesetsisacondensedrepresentationandwecanregeneratea儿frequentpatternsandtheirexactfrequenciesbyusingrule-freesets.Rule-freesetsismuchsmallerthanthewholefrequentpatterncollectionandtheprocessofregenerationCallb

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。