基于weka平台决策树算法设计和实现

基于weka平台决策树算法设计和实现

ID:32029657

大小:2.04 MB

页数:68页

时间:2019-01-30

基于weka平台决策树算法设计和实现_第1页
基于weka平台决策树算法设计和实现_第2页
基于weka平台决策树算法设计和实现_第3页
基于weka平台决策树算法设计和实现_第4页
基于weka平台决策树算法设计和实现_第5页
资源描述:

《基于weka平台决策树算法设计和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要决策树方法在数据挖掘技术中具有很重要的作用,随着数据挖掘分类技术的广泛应用,决策树算法取得了众多研究成果,本文在深入研究和分析了主流决策树算法的基础上,基于WEKA数据挖掘平台进行了决策树算法的设计与实现,不仅有效的利用了已有数据挖掘工具,而且就已有决策树算法较少涉及的领域进行了大胆的研究和创新,提出了一种新的多值属性多类标数据决策树算法,并进行了新算法的设计与实现工作。首先,详细介绍了开放性数据挖掘平台WEKA的功能及结构,在对决策树算法性能评价标准进行研究的基础上,本文基于WEKA平台进行了经典决策树算法性能分析的

2、实验,并就算法的评价指标对不同算法的性能进行了比较与分析。其次,本文对经典决策树算法的实现原理进行了深入研究,在认真学习了WEKA系统结构的基础上,将SPRINT算法在WEKA平台上实现了封装和应用,并对封装后的算法性能进行了测试,有效的利用已有数据挖掘工具实现了个性化算法的设计及应用。为了提高对多值属性多类标数据的处理能力,本文在已有决策树算法的基础上,结合应用统计学、概率论等数学原理,提出了一种新的多值属性多类标数据决策树算法SSC。SSC算法在属性分类效果的评定机制中综合考虑了集合的同~性和一致性特征,对已有算法中基

3、于一致性的相似度计算方法提出了改进方案,还提出在评定算法预测准确率时应采用相同的相似度评定方法的思想。最后,通过在WEKA平台中的设计和封装,进行了算法性能测试,实验结果表明SSC算法能更有效的解决多值属性多类标数据的分类问题。关键词:数据挖掘,决策树算法,WEKA,SPRINT,多值属性多类标数据决策树算法ABSTRACTDecisiontreeclassifiertakesmuchimportanceinthetechnologyofDatamining.Asthewideapplicationsofclassifie

4、rofDatamining,decisiontreeclassifierhasachievedmuchresearchachievement.Basedondeepresearchinthemainalgorithmsofdecisiontree,thisdissertationfinishesthedesigningandcarryingofdecisiontreeclassifiersontheplatformofWEKA.whichnotonlyrealizesineffecttheutilizationofthed

5、ataminerinexistence.butalsotakesbraveryresearchesandinnoval:ionsintherareconcemedfieldofdecisiontreeclassifier,andalsoperformstherealizingofnewalgorithmofdecisiontree.Firsty,afterdescriptionsindetailofthefunctionandstructureofdataminerWEKA.basedontheresearchofcrit

6、erionsforevaluatingdecisiontreeclassifiers’performance,thisdissertationtakesanalyticexperimentsofclassicdecisiontreeclassifiersontheplatformofWEKA.anddoessomecomparisonsandanalysesaccordingtodifferentcriterionsforevaluating.Secondly,thisdissertationtakesdeepresear

7、chesintheperformingtheoryofclassicdecisiontreeclassifiers.BasedonseriousstudyinthesystemstructureofWEKA,wetakethealgorithmofSPRINTout,andalsotaketestexperimentsforthealgorithms’performance,whichutilizesdataminerineffecttocarryoutindividualalgorithms.Inordertoimpro

8、vetheabilityofdealingwithmulti-valuedandmulti—lableddata,thisdissertationdiscussesanewmulti—valuedandmulti.1ableddatadecisiontreeclassifier,onthebasisof

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。