加权负关联规则挖掘技术的研究

加权负关联规则挖掘技术的研究

ID:37371046

大小:2.49 MB

页数:53页

时间:2019-05-22

加权负关联规则挖掘技术的研究_第1页
加权负关联规则挖掘技术的研究_第2页
加权负关联规则挖掘技术的研究_第3页
加权负关联规则挖掘技术的研究_第4页
加权负关联规则挖掘技术的研究_第5页
资源描述:

《加权负关联规则挖掘技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、山东轻工业学院硕士学位论文摘要关联规则的研究是数据挖掘的一个重要分支,已经引起很多学者的广泛关注。本文介绍了数据挖掘技术的相关知识,尤其是关联规则的挖掘,并介绍了基本概念及经典的算法。过去的研究往往认为数据库各个项目的重要程度是相同的。而事实上,用户对项目的看重程度是不同的。因此已有算法挖掘出来的并不一定是我们感兴趣的规则。针对这种情况,提出了加权关联规则。另一方面,有时候我们关心的是数据库中那些低频率强相关的规则,即负关联规则。由于在加权关联规则的基础上同时挖掘正负关联规则,会产生一些矛盾的和无意义的规则,因此,在传统支持度——置信度框架下,引入第三个参数删除冗余规则。提出了基于相关

2、性挖掘正负加权关联规则的算法:基于兴趣度的加权正负关联规则的挖掘算法;基于卡方检验的加权正负关联规则挖掘算法。当数据库分布极不均匀时,上述对于关联规则的挖掘并不是有效的。因为出现频率较低的项目其支持度往往较低,因此很少被挖掘出来。针对这个问题,提出多支持度的模型,对于不同的事务采用不同的最小支持度闽值,更有效挖掘出用户感兴趣的规则。以上关联规则均在频繁项集中挖掘,但负关联规则更多的是存在于非频繁项集中。本人提出了一种生成非频繁项集的算法,并采用相关性作为度量删除负关联中的矛盾规则,该算法有效的挖掘出大量的负关联规则。将上面的数据挖掘理论应用到关联规则的发现中我们完成了相应算法的设计并且

3、通过理论分析和实验模拟讨论了算法的性能,证明算法是可行的、有效的。关键词:权值;数据挖掘;负关联规则;非频繁项集山东轻工业学院硕士学位论文ABSTRACTAssociationrulesminingisaformofdatarniningandithasattractedmuchattentionfromresearehers.Therelatedknowledgeofdataminingisintroduced,includingconceptionandclasscicalalgorithm,especiallythatoftheassociationrules.However,t

4、raditionalAlgorithmAprioritreatseachiteminthedatabaseasuniformity.Butintherealworld,theimportanceofeachitemisoftendifferent.Therefor,theminedassociationrulesthoughthepastalgorithmsmaybenotinterestingfortheusers.Theweighedassociationrulesdataminingisproposedtosolvetheaboveproblem.Ontheotherhand,t

5、heusersal'einterestedinlowfrequentandstrongcorrelaterules,whicharenagativeassociationrules.Thepositiveandnegativerulesareminedsimultaneouslybasedonmining’forweightedassociationrules,SOmanycontraryanduninterestingrulesaremined.Onthecondition,thethirdmeasureisaddedtotheframeworkof“support-confiden

6、ce”toclimatethecontraryrules.Thealgorithmofminingthepositiveandnegativeweightedassociationrulesbasedoncorrelationisproposed;thealgorithmofminingthepositiveandnegativeassociationrulesbasedoninterestisproposed;thealgorithmofminingthepositiveandnegativeassociationrulesbasedonChi—squareisproposed.Bu

7、tthereisanothercasethatthefrequencyofeveryitemisdifferentfromeachother,theabovealgorithmsmaybenoteffeeitive。IfoccurrencefrequenceoftheitemsislOW,thentheweightedsupportwillbeverylow.Inthatcase,thefewrulescanbemined.Themodelof

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。