weka Apriori算法实验

weka Apriori算法实验

ID:40490546

大小:40.33 KB

页数:7页

时间:2019-08-03

weka Apriori算法实验_第1页
weka Apriori算法实验_第2页
weka Apriori算法实验_第3页
weka Apriori算法实验_第4页
weka Apriori算法实验_第5页
资源描述:

《weka Apriori算法实验》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、weka–Apriori算法 关联规则挖掘实验 一、Apriori算法参数含义本次共进行了9组实验,使用了weka安装目录data文件夹下的contact-lenses.arff数据。  ToolsàArffViewer,打开contact-lenses,可以看到实验数据contact-lenses共有24条记录,5个属性值。具体内容如下:结合实验结果阐释下列12个参数的含义1.        car 如果设为真,则会挖掘类关联规则而不是全局关联规则。2.        classindex 类属性索引。如果设置为-1,最后的属性被当做类属性。3.        delta 以此数值为迭

2、代递减单位。不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。4.        lowerBoundMinSupport 最小支持度下界。5.        metricType 度量类型。设置对规则进行排序的度量依据。可以是:置信度(类关联规则只能用置信度挖掘),提升度(lift),杠杆率(leverage),确信度(conviction)。在 Weka中设置了几个类似置信度(confidence)的度量来衡量规则的关联程度,它们分别是:a)        Lift : P(A,B)/(P(A)P(B))Lift=1时表示A和B独立。这个数越大(>1),越表明A和B存在于一

3、个购物篮中不是偶然现象,有较强的关联度.b)        Leverage:P(A,B)-P(A)P(B)Leverage=0时A和B独立,Leverage越大A和B的关系越密切c)        Conviction:P(A)P(!B)/P(A,!B) (!B表示B没有发生) Conviction也是用来衡量A和B的独立性。从它和lift的关系(对B取反,代入Lift公式后求倒数)可以看出,这个值越大,A、B越关联。6.        minMtric 度量的最小值。7.        numRules 要发现的规则数。8.        outputItemSets 如果设置为真,

4、会在结果中输出项集。9.        removeAllMissingCols 移除全部为缺省值的列。10.    significanceLevel 重要程度。重要性测试(仅用于置信度)。11.    upperBoundMinSupport 最小支持度上界。 从这个值开始迭代减小最小支持度。12.    verbose 如果设置为真,则算法会以冗余模式运行。  二、实验结果及分析1. 以其中一组实验为例做详细分析具体参数设置如下图: 完整的实验结果输出及具体分析===Runinformation===     // 实验运行信息 Scheme:       weka.associa

5、tions.Apriori-I-N10-T0-C0.9-D0.05-U1.0-M0.5-S-1.0-c-1Relation:     contact-lenses       //数据的名称 contact-lensesInstances:    24         //数据的记录数 24Attributes:   5         //属性数目 5以及各属性名称              age              spectacle-prescrip              astigmatism              tear-prod-rate          

6、    contact-lenses===Associatormodel(fulltrainingset)===%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  scheme-所选的关联规则挖掘方案: Apriori算法%  算法的参数设置:-I-N10-T0-C0.9-D0.05-U1.0-M0.5-S-1.0-c-1;%  各参数依次表示:%  I- 输出项集,若设为false则该值缺省;%  N10- 规则数为10;%  T0– 度量单位选为置信度,(T1-提升度,T2杠杆率,T3确信度);%  C0.9– 度量的最小值为0.9;%  D0.05- 递减迭代值为0.0

7、5;%  U1.0- 最小支持度上界为1.0;%  M0.5- 最小支持度下届设为0.5;%  S-1.0- 重要程度为-1.0;%  c-1- 类索引为-1输出项集设为真%  (由于car,removeAllMissingCols,verbose都保持为默认值False,因此在结果的参数设置为缺省,若设为True,则会在结果的参数设置信息中分别表示为A,R,V)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  Apr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。