资源描述:
《基于决策树的数据挖掘-汽车评价分类的算法设计与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、基于决策树的数据挖掘——汽车评价分类的算法设计与实现1决策树技术面临的挑战及目前研究方向随着数据挖掘技术的兴起,作为拟人决策主要方法之一,近年来决策树又重新引起了人们的兴趣,并得到更广泛的应用。目前决策树技术的主要研究方向有以下几点:1.1决策树技术与其他技术的结合如何将决策树技术和其他新兴的技术相结合以便取长补短一直是决策树技术研究的热点,近几年来国际上发表的有关决策树的文章也大多集中在这个方面的研究。近年关于决策树和其他技术的研究主要包括:1.1.1决策树技术和神经网络技术相结合[[1]BozO.Extractingdecisiontreesfromtrainedneu
2、ralnet-works[C].Edmonton,Alberta,Canada:ProcoftheEnglishACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining,2002.][[2]SethiL.Entropynets:fromdecisiontreestoneuralnet-works[J].ProcofIEEE,1990,78(10):1605-1613.]。人工神经网络的多层结构使它具有对任意输入输出进行映射的功能。同样,决策树也具有产生维空间下任意复杂的决策边界的功能。因此,可以将决策
3、树重新构造成一个多层的神经网络。这种由决策树转化而成的神经网络具有加快神经网络训练速度等优点。另外一类方法正好相反,它研究的是由神经网络中得到所需要的决策树。这类方法解决了由神经网络得到的知识难于被人们理解的缺点。1.1.2决策树技术和模糊集合原理的结合决策树技术虽然有许多优点,但也存在着不稳定的缺点,即决策树带来了较大的变动。模糊集合的融通性使人们利用模糊逻辑来解决决策树的这一缺点并取得了不错的效果。最近,C.Olaru提出了一种新的模糊决策树方法-软决策树[[3]OlaruC,WehenkelL.Acompletefuzzydecisiontreetechnique[J
4、].FuzzySetsandSystems,2003,138(2):221-254.]。软决策树综合决策树的生成和修剪来决定其本身的结构,并利用重修(Refitting)和磨合(Backfitting)来提高树的归纳能力。软决策树比一般决策树的正确率要高。此外,M.Dong等人提出的基于前瞻(Look-Ahead)的模糊决策树也能够在得到较好的归纳特性的前提下产生较小体积的决策树[[4]DongM,KothariR.Look-aheadbasedfuzzydecisiontreeinduction[J].IEEETransactionsonFuzzySystems,2002
5、,9(3):461-468.]。1.1.3决策树技术和进化算法,遗传算法及遗传编程的结合[[5]Cantu-PazE,KamathC.InducingobliquedecisiontreeswithevolutionaryAlgorithms[J].IEEETransactionsonEvolutionaryComputation,2003,7(1):54-68.][[6]PapagelisA,KallesD.Breedingdecisiontreesusingevolutionarytechniques[C].USA:ProceedingsofICML’01,USA,20
6、01.][[7]PapagelisA,KallesD.GAtree:geneticallyevolveddecisiontrees[C].USA:ProceedingsofICTAIP00,2000.][[8]TurG,GuvenirHA.Decisiontreeinductionusinggeneticprogramming[C].Ankara,Turkish:ProceedingsoftheFifthTurkishSymposiumonArtificialIntelligenceandNeuralNetworks,1996.][[9]EggermontJ.Evolvin
7、gfuzzydecisiontreeswithgeneticprogrammingandclustering[C].Milan,Italy:Proceedingsofthe4thEuropeanConferenceonGeneticProgramming,2001.]。基于进化算法的决策树系统具有较好的抗噪声能力,同时进化算法很容易在并行计算机上运行,因此可以期待基于进化算法的决策树的运算能力有较大的提高。此外,由于进化算法为随机算法,它可以在任何时候对同一数据集合产生不同的决策树,通过利用投票(Vote)的方法可