欢迎来到天天文库
浏览记录
ID:37371046
大小:2.49 MB
页数:53页
时间:2019-05-22
《加权负关联规则挖掘技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、山东轻工业学院硕士学位论文摘要关联规则的研究是数据挖掘的一个重要分支,已经引起很多学者的广泛关注。本文介绍了数据挖掘技术的相关知识,尤其是关联规则的挖掘,并介绍了基本概念及经典的算法。过去的研究往往认为数据库各个项目的重要程度是相同的。而事实上,用户对项目的看重程度是不同的。因此已有算法挖掘出来的并不一定是我们感兴趣的规则。针对这种情况,提出了加权关联规则。另一方面,有时候我们关心的是数据库中那些低频率强相关的规则,即负关联规则。由于在加权关联规则的基础上同时挖掘正负关联规则,会产生一些矛盾的和无意义的规则,因此,在传统支持度——置信度框架下,引入第三个参数删除冗余规则。提出了基于相关
2、性挖掘正负加权关联规则的算法:基于兴趣度的加权正负关联规则的挖掘算法;基于卡方检验的加权正负关联规则挖掘算法。当数据库分布极不均匀时,上述对于关联规则的挖掘并不是有效的。因为出现频率较低的项目其支持度往往较低,因此很少被挖掘出来。针对这个问题,提出多支持度的模型,对于不同的事务采用不同的最小支持度闽值,更有效挖掘出用户感兴趣的规则。以上关联规则均在频繁项集中挖掘,但负关联规则更多的是存在于非频繁项集中。本人提出了一种生成非频繁项集的算法,并采用相关性作为度量删除负关联中的矛盾规则,该算法有效的挖掘出大量的负关联规则。将上面的数据挖掘理论应用到关联规则的发现中我们完成了相应算法的设计并且
3、通过理论分析和实验模拟讨论了算法的性能,证明算法是可行的、有效的。关键词:权值;数据挖掘;负关联规则;非频繁项集山东轻工业学院硕士学位论文ABSTRACTAssociationrulesminingisaformofdatarniningandithasattractedmuchattentionfromresearehers.Therelatedknowledgeofdataminingisintroduced,includingconceptionandclasscicalalgorithm,especiallythatoftheassociationrules.However,t
4、raditionalAlgorithmAprioritreatseachiteminthedatabaseasuniformity.Butintherealworld,theimportanceofeachitemisoftendifferent.Therefor,theminedassociationrulesthoughthepastalgorithmsmaybenotinterestingfortheusers.Theweighedassociationrulesdataminingisproposedtosolvetheaboveproblem.Ontheotherhand,t
5、heusersal'einterestedinlowfrequentandstrongcorrelaterules,whicharenagativeassociationrules.Thepositiveandnegativerulesareminedsimultaneouslybasedonmining’forweightedassociationrules,SOmanycontraryanduninterestingrulesaremined.Onthecondition,thethirdmeasureisaddedtotheframeworkof“support-confiden
6、ce”toclimatethecontraryrules.Thealgorithmofminingthepositiveandnegativeweightedassociationrulesbasedoncorrelationisproposed;thealgorithmofminingthepositiveandnegativeassociationrulesbasedoninterestisproposed;thealgorithmofminingthepositiveandnegativeassociationrulesbasedonChi—squareisproposed.Bu
7、tthereisanothercasethatthefrequencyofeveryitemisdifferentfromeachother,theabovealgorithmsmaybenoteffeeitive。IfoccurrencefrequenceoftheitemsislOW,thentheweightedsupportwillbeverylow.Inthatcase,thefewrulescanbemined.Themodelof
此文档下载收益归作者所有