weka算法参数整理

weka算法参数整理

ID:43510663

大小:2.12 MB

页数:31页

时间:2019-10-09

weka算法参数整理_第1页
weka算法参数整理_第2页
weka算法参数整理_第3页
weka算法参数整理_第4页
weka算法参数整理_第5页
资源描述:

《weka算法参数整理》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、1.关联算法1.1.Aprior算法1.1.1.Apriori算法weka参数界面概要实现Apriori关联规则挖掘算法,挖掘出给定参数条件下的关联规则。此迭代的减少最小支持度直到发现设定最小置信度下的规则数目。1.1.2.Apriori算法参数配置说明英文名称中文翻译默认值取值范围参数说明car分类关联分析FalseFalse返回常规的关联分析规则True返回指定分类属性的关联规则classIndex分类属性索引-1{-1,[1,N]}int-1代表最后一列,设置的数字代表相应的列作为分类属性;Car为True时生效。deltadelta0.05(0,1)每次迭代u

2、pperBoundMinSupport减少的数值,直到最小支持度或设定规则数目。lowerBoundMinSupport最小支持度下限0.1(0,upperBoundMinSupport)迭代过程中最小支持度的下限。metricType度量类型confidenceConfidence(置信度)规则项集数目占规则前件数目比例;car为True,metricType只能用confidence。P(A,B)/P(A)P(B);规则前件和规则后件同时发生的概率除以分布单独发生的概率Lift(提升度)>1之积;Lift=1时表示A和B独立,数值越大前后件关联性越强。Levera

3、ge(杠杆率)P(A,B)-P(A)P(B);Leverage=0时A和B独立,数值越大A和B的关联性越强。P(A)P(!B)/P(A,!B)(!B表示B没有发生)Conviction也是用来衡量A和B的Conviction(确信度)独立性。从它和lift的关系(对B取反,代入Lift公式后求倒数)可以看出,这个值越大,A、B越关联。minMetric最小度量值0.9根据metricType取值不同Confidence(0,1);lift>1;leverage>0;conviction(0,1)numRules规则数目10[1,+∞]int关联算法产生规则的数目out

4、putItemSets输出项集FalseFalse不输出频繁项集True输出频繁项集removeAllMissingCols移除空列FalseFalse不移除所有值都缺失的列True移除所有值都缺失的列significanceLevel显著性水平-1?(0,1)χ2检验的显著性水平,-1则不进行检验。(仅适用于置信度度量)treatZeroAsMissing按照缺失值处理零FalseFalse不按照缺失值的相同方式处理零(标称型的第一个值)True按照缺失值的相同方式处理零(标称型的第一个值)upperBoundMinSupport最小支持度上限1(lowerBoun

5、dMinSupport,1]迭代过程中最小支持度的上限;迭代过程中从该值开始降低。verbose详细模式FalseFalse算法不以冗余模式运行True算法以冗余模式运行2.聚类2.1.weka聚类主界面及参数说明2.1.1.聚类算法主界面2.1.2.聚类算法主界面参数说明英文名称中文翻译配置说明Usetrainingset使用训练集使用训练集训练并直接使用训练集测试。Suppliedtestset提供测试集使用训练集训练模型,从文件中加载一组测试实例,单击“Set...”按钮选择测试文件,进行模型测试。Percentagesplit分割百分比取出特定百分比的数据作为

6、训练数据,其他作为测试数据。Classtoclustersevaluations类作为评估准则比较所选择的簇与预先指定的类的匹配程度。Storeclusterforvisualization为可视化保存簇选择后训练完成后,保存簇以供可视化使用2.2.SimpleKMeans算法2.2.1.SimpleKMeans算法参数配置用户界面和开发模式界面2.2.2.SimpleKMeans聚类算法参数配置说明英文名称中文翻译默认值取值范围参数说明canopyMaxNumCanopiesToHoldI内存中最大canopy数目100[1,+∞)如果用canopy聚类方法进行初始

7、化,这个参数就是在内存中保存nMemory的最大的候选canopies数目。canopyMinimumCanopyDensity最低canopy密度2.0?在使用canopy初始化时,在修剪时的canopy最低密度。canopyPeriodicPruningRate修剪周期10000?如果用canopy初始化,参数为修剪低密度canopies周期。canopyT1Canopy聚类T1半径-1.25(T2,+∞)canopy聚类时T1半径,当小于0时,T1=(-values)*T2。canopyT2Canopy聚类T2半径-1(-∞,T1)canopy

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。