加权关联规则挖掘和基于兴趣度知识评价研究

加权关联规则挖掘和基于兴趣度知识评价研究

ID:36615099

大小:1.94 MB

页数:56页

时间:2019-05-13

加权关联规则挖掘和基于兴趣度知识评价研究_第1页
加权关联规则挖掘和基于兴趣度知识评价研究_第2页
加权关联规则挖掘和基于兴趣度知识评价研究_第3页
加权关联规则挖掘和基于兴趣度知识评价研究_第4页
加权关联规则挖掘和基于兴趣度知识评价研究_第5页
资源描述:

《加权关联规则挖掘和基于兴趣度知识评价研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要在数据库知识发现(KKD)研究中,许多关联规则挖掘和基于兴趣度的知识客观评价,把数据库中的各属性假设为具有相同的重要性。但在某些研究和应用领域,不同的属性在用户看来应具有不同的重要性,为体现属性的重要性,引入属性加权。如何对加权后的关联规则进行挖掘及评价,这就是本文的研究工作。在加权关联规则挖掘的研究中,主要的工作是从事务数据库中产生加权频繁项目集。由于加权频繁项目集不具有向下封闭性,也就是,加权频繁项目集的子集不一定加权频繁。因此,不能用现有的Apriori算法及其改进算法产生加权频繁项目集。本文针对已有的一些加权关联规则挖掘方法中的不足,设计了两个不同的挖掘加权频繁项

2、目集的算法,并对这两个算法加以比较。与算法一相比,理论上,算法二是基于格的理论设计,有效减少了候选集中元素的个数,并通过对原始事务数据库进行转化,使得计算项目集的支持数的方法较为简单,且扫描数据库的次数较少,因此,算法二比算法一要好。在实验上,本研究实现了这两个算法,并在合成数据上运行,验证了这两个算法的正确性和有效性。并且,这两个算法在各种实验数据上运行的结果表明,算法二在执行时间上的效率要优于算法一,且扩展性较好,符合理论分析结果。在基于兴趣度的知识评价研究中,本文给出了兴趣度定义,并对兴趣度的取值进行了讨论。用兴趣度对规则评价时,通过设定最小兴趣度闽值,以产生用户感兴趣

3、的知识。此外,本文还把兴趣度扩展为加权兴趣度,以对挖掘产生的加权关联规则进行评价,得到对用户具有实际指导意义的知识。关键字:数据挖掘,数据库知识发现,加权关联规则,加权频繁项目集,兴趣度,加权兴趣度,知识评价ABSTRACTThesameimportanceoftheatributesareconsideredinsomestudiesofminingassociationrulesandobjectiveevaluationofknowledgebasinginterestinKKD.Butdiferentclientviewtheatributeshavingdifere

4、ntimportanceinsomefieldsofthestudyandapplication.Thus,theattributesaregivenweightsforreflectingtheirimportance.Howtominingandevaluatingtheassociationruleswithweightsisstudiedinthispaper.Inthestu勿ofminingassociationruleswithweight,itismajorworktoobtainthefrequentitemswithweights.Thepresented

5、Apriorialgorithmanditsimprovingalgorithmcan'tbeusedinproducingfrequentitemswithweights,becauseoftheyarenotdownwardclosure.Thus,twodiferentalgorithmsaredesignedtominingfrequentitemswithweights.Thealgorithmsimprovetheexistedalgorithmsofminingfrequentitemswithweights.Comparingthefirstalgorithm

6、,thesecondalgorithmbaseonlaticetheoryanddecreasethenumberofcandidateitemsThroughtranslatingtheprimitivedatabase,thesecondalgorithmmakecalculatingthecountsofitemssimplyandthenumberofscanningdatabasedecrease.Thusthesecondalgorithmisbetterthanthefirst.Thetwoalgorithmsarefulfilledinexperimentan

7、dtestedbyusingsyntheticdata.Theexperimentalresultvalidatethealgorithmsarecorrectandvalid.Usingdiferenttestingdata,theresultshowthatthesecondalgorithmexceedthefirstintimeanditsexpansibilityisverygood.Thisisaccordancetotheanalysisintheory.Inthestudyofknowl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。