欢迎来到天天文库
浏览记录
ID:32029657
大小:2.04 MB
页数:68页
时间:2019-01-30
《基于weka平台决策树算法设计和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要决策树方法在数据挖掘技术中具有很重要的作用,随着数据挖掘分类技术的广泛应用,决策树算法取得了众多研究成果,本文在深入研究和分析了主流决策树算法的基础上,基于WEKA数据挖掘平台进行了决策树算法的设计与实现,不仅有效的利用了已有数据挖掘工具,而且就已有决策树算法较少涉及的领域进行了大胆的研究和创新,提出了一种新的多值属性多类标数据决策树算法,并进行了新算法的设计与实现工作。首先,详细介绍了开放性数据挖掘平台WEKA的功能及结构,在对决策树算法性能评价标准进行研究的基础上,本文基于WEKA平台进行了经典决策树算法性能分析的
2、实验,并就算法的评价指标对不同算法的性能进行了比较与分析。其次,本文对经典决策树算法的实现原理进行了深入研究,在认真学习了WEKA系统结构的基础上,将SPRINT算法在WEKA平台上实现了封装和应用,并对封装后的算法性能进行了测试,有效的利用已有数据挖掘工具实现了个性化算法的设计及应用。为了提高对多值属性多类标数据的处理能力,本文在已有决策树算法的基础上,结合应用统计学、概率论等数学原理,提出了一种新的多值属性多类标数据决策树算法SSC。SSC算法在属性分类效果的评定机制中综合考虑了集合的同~性和一致性特征,对已有算法中基
3、于一致性的相似度计算方法提出了改进方案,还提出在评定算法预测准确率时应采用相同的相似度评定方法的思想。最后,通过在WEKA平台中的设计和封装,进行了算法性能测试,实验结果表明SSC算法能更有效的解决多值属性多类标数据的分类问题。关键词:数据挖掘,决策树算法,WEKA,SPRINT,多值属性多类标数据决策树算法ABSTRACTDecisiontreeclassifiertakesmuchimportanceinthetechnologyofDatamining.Asthewideapplicationsofclassifie
4、rofDatamining,decisiontreeclassifierhasachievedmuchresearchachievement.Basedondeepresearchinthemainalgorithmsofdecisiontree,thisdissertationfinishesthedesigningandcarryingofdecisiontreeclassifiersontheplatformofWEKA.whichnotonlyrealizesineffecttheutilizationofthed
5、ataminerinexistence.butalsotakesbraveryresearchesandinnoval:ionsintherareconcemedfieldofdecisiontreeclassifier,andalsoperformstherealizingofnewalgorithmofdecisiontree.Firsty,afterdescriptionsindetailofthefunctionandstructureofdataminerWEKA.basedontheresearchofcrit
6、erionsforevaluatingdecisiontreeclassifiers’performance,thisdissertationtakesanalyticexperimentsofclassicdecisiontreeclassifiersontheplatformofWEKA.anddoessomecomparisonsandanalysesaccordingtodifferentcriterionsforevaluating.Secondly,thisdissertationtakesdeepresear
7、chesintheperformingtheoryofclassicdecisiontreeclassifiers.BasedonseriousstudyinthesystemstructureofWEKA,wetakethealgorithmofSPRINTout,andalsotaketestexperimentsforthealgorithms’performance,whichutilizesdataminerineffecttocarryoutindividualalgorithms.Inordertoimpro
8、vetheabilityofdealingwithmulti-valuedandmulti—lableddata,thisdissertationdiscussesanewmulti—valuedandmulti.1ableddatadecisiontreeclassifier,onthebasisof
此文档下载收益归作者所有