资源描述:
《weka算法参数整理.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、1.关联算法1.1.Aprior算法1.1.1.Apriori算法weka参数界面概要实现Apriori关联规则挖掘算法,挖掘出给定参数条件下的关联规则。此迭代的减少最小支持度直到发现设定最小置信度下的规则数目。1.1.2.Apriori算法参数配置说明英文名称中文翻译默认值取值范围参数说明car分类关联分析FalseFalse返回常规的关联分析规则True返回指定分类属性的关联规则classIndex分类属性索引-1{-1,[1,N]}int-1代表最后一列,设置的数字代表相应的列作为分类属性;Car为True时生
2、效。deltadelta0.05(0,1)每次迭代upperBoundMinSupport减少的数值,直到最小支持度或设定规则数目。lowerBoundMinSupport最小支持度下限0.1(0,upperBoundMinSupport)迭代过程中最小支持度的下限。metricType度量类型confidenceConfidence(置信度)规则项集数目占规则前件数目比例;car为True,metricType只能用confidence。P(A,B)/P(A)P(B);规则前件和规则后件同时发生的概率除以分布单独发
3、生的概率Lift(提升度)>1之积;Lift=1时表示A和B独立,数值越大前后件关联性越强。Leverage(杠杆率)P(A,B)-P(A)P(B);Leverage=0时A和B独立,数值越大A和B的关联性越强。P(A)P(!B)/P(A,!B)(!B表示B没有发生)Conviction也是用来衡量A和B的Conviction(确信度)独立性。从它和lift的关系(对B取反,代入Lift公式后求倒数)可以看出,这个值越大,A、B越关联。minMetric最小度量值0.9根据metricType取值不同Confiden
4、ce(0,1);lift>1;leverage>0;conviction(0,1)numRules规则数目10[1,+∞]int关联算法产生规则的数目outputItemSets输出项集FalseFalse不输出频繁项集True输出频繁项集removeAllMissingCols移除空列FalseFalse不移除所有值都缺失的列True移除所有值都缺失的列significanceLevel显著性水平-1?(0,1)χ2检验的显著性水平,-1则不进行检验。(仅适用于置信度度量)treatZeroAsMissing按照缺
5、失值处理零FalseFalse不按照缺失值的相同方式处理零(标称型的第一个值)True按照缺失值的相同方式处理零(标称型的第一个值)upperBoundMinSupport最小支持度上限1(lowerBoundMinSupport,1]迭代过程中最小支持度的上限;迭代过程中从该值开始降低。verbose详细模式FalseFalse算法不以冗余模式运行True算法以冗余模式运行2.聚类2.1.weka聚类主界面及参数说明2.1.1.聚类算法主界面2.1.2.聚类算法主界面参数说明英文名称中文翻译配置说明Usetrain
6、ingset使用训练集使用训练集训练并直接使用训练集测试。Suppliedtestset提供测试集使用训练集训练模型,从文件中加载一组测试实例,单击“Set...”按钮选择测试文件,进行模型测试。Percentagesplit分割百分比取出特定百分比的数据作为训练数据,其他作为测试数据。Classtoclustersevaluations类作为评估准则比较所选择的簇与预先指定的类的匹配程度。Storeclusterforvisualization为可视化保存簇选择后训练完成后,保存簇以供可视化使用2.2.Simple
7、KMeans算法2.2.1.SimpleKMeans算法参数配置用户界面和开发模式界面2.2.2.SimpleKMeans聚类算法参数配置说明英文名称中文翻译默认值取值范围参数说明canopyMaxNumCanopiesToHoldI内存中最大canopy数目100[1,+∞)如果用canopy聚类方法进行初始化,这个参数就是在内存中保存nMemory的最大的候选canopies数目。canopyMinimumCanopyDensity最低canopy密度2.0?在使用canopy初始化时,在修剪时的canopy最低
8、密度。canopyPeriodicPruningRate修剪周期10000?如果用canopy初始化,参数为修剪低密度canopies周期。canopyT1Canopy聚类T1半径-1.25(T2,+∞)canopy聚类时T1半径,当小于0时,T1=(-values)*T2。canopyT2Canopy聚类T2半径-1(-∞,T1)canopy