关联规则挖掘兴趣度模型探究

关联规则挖掘兴趣度模型探究

ID:5602652

大小:27.00 KB

页数:5页

时间:2017-12-19

关联规则挖掘兴趣度模型探究_第1页
关联规则挖掘兴趣度模型探究_第2页
关联规则挖掘兴趣度模型探究_第3页
关联规则挖掘兴趣度模型探究_第4页
关联规则挖掘兴趣度模型探究_第5页
资源描述:

《关联规则挖掘兴趣度模型探究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、关联规则挖掘兴趣度模型探究  摘要:通过查阅相关文献资料,收集整理了基于概率兴趣度模型、差异思想兴趣度模型、相关性兴趣度模型、信息量兴趣度模型、影响兴趣度模型的计算公式,并利用VisualFoxPro编程语言实现这些兴趣度模型的关联规则挖掘算法。通过实验分析了各种兴趣度模型的取值与规则显示间的关系,并简要分析总结了各种兴趣度模型的基本特点。关键词:关联规则;兴趣度;规则显示中图分类号:TP391文献标识码:A文章编号:1009-3044(2014)06-1223-04OnInterestMeasureModelsofMiningAssociationRulesLI

2、Zuo-jun(DepartmentofInformationScience&Technology,LincangTeachers’Colleges,Lincang677000,China)Abstract:Byreviewingtherelevantliterature,theauthorcollectedsomecomputingformulasbasedoninterestmeasuremodelsofprobability,diversitythought,correlation,informationamountandinfluenceandimplem

3、entedthealgorithmofminingassociationrulesofthosemodelsbyusing5programminglanguageofVisualFoxPro.Inthepaper,theauthoralsoanalyzedtherelationshipsbetweenvalueandrules-showofthemodelsandgaveabriefconclusionofthegeneralfeaturesofthemodelsthroughexperimentalanalysis.Keywords:associationrul

4、es;interestmeasure;rulesshow判断关联规则挖掘结果是否有趣的标准分为客观兴趣度和主观兴趣度,其中客观感兴趣度主要根据模式或规则的形式和数据库中的数据进行定义,属于数据驱动;而主观兴趣度还要考虑用户的参与等人为因索的影响属于用户驱动[1]。目前所研究的兴趣度主要是指客观兴趣度,通过查阅相关文献资料,介绍几种经典的客观兴趣度模型,并作简要的解释和剖析。在介绍兴趣度模型之前,先对关联规则的两个传统阈值作一个简单介绍:假设关联规则描述为(X?Y),X为规则前件,Y为规则后件,规则支持度S(X?Y)表示为(1)式,置信度C(X?Y)表示为(2)式,

5、而兴趣度I(X?Y)正是本文讨论的内容。[S(X?Y)=P(X?Y)=Count(X)N×100%](1)[C(X?Y)=P(X

6、Y)=S(X?Y)S(X)=Count(X?Y)Count(X)×100%](2)5其中D表示事务数据库,N表示事务数据库D中各项事务数的总和,Count(X)表示事务X在事务数据库D中的出现次数,Count(X∪Y)表示事务X、Y在事务数据库D中同时出现的次数。1概率兴趣度1.1概率兴趣度模型文献[2]提出了基于概率的关联规则兴趣度模型,其值表示为(3)式。[IX?Y=1-PY1-PX1-PY

7、X](3)其中P(X)表示事务X在事务库

8、中出现概率Count(X)/N,P(Y)表示事务Y在事务库中出现概率Count(Y)/N,P(Y

9、X)表示事务X出现条件下事务X和Y同时出现概率Count(X∪Y)/Count(X)。1.2概率兴趣度模型的特点分析使用VisualFoxPro编程实现基于概率兴趣度模型的关联规则挖掘算法,并且在取不同兴趣度值情况下记录显示关联规则数,具体见表1所示。概率兴趣度与规则数关系如图1所示。表1概率兴趣度取值与规则显示数目表图1概率兴趣度与规则数关系图5从图1可看出,兴趣度I(X?Y)函数值越大,规则越有价值。在兴趣度I(X?Y)的定义中,考虑到了规则(X?Y)的前项X和后

10、项Y的耦合,同时考虑到如果对大概率事件产生的原因知道得较多,而可能对大概率事件导致的结果更加感兴趣的特点;但是兴趣度与信任度C(X?Y)不同,兴趣度I(X?Y)重点对S(Y)小的规则赋予大的兴趣度[3]。基于概率兴趣度模型主要考虑规则的简洁性、支持度以及后项的影响,却没有考虑规则前项对规则的影响。2差异思想兴趣度2.1差异思想兴趣度模型文献【4】提出了一种基于差异思想的兴趣度模型,用以指导关联规则的发现,将关联规则(X?Y)的兴趣度表示为:[IX?Y=CX?Y-SYmaxCX?Y,SY](4)其中,C(X?Y)为关联规则(X?Y)的置信度,其值为(2)式所示;S(

11、Y)为关联

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。