资源描述:
《决策树论文:基于敏感度的可抗噪的模糊SLIQ决策树》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、决策树论文:基于敏感度的可抗噪的模糊SLIQ决策树【中文摘要】决策树作为数据挖掘领域最为广泛使用的技术之,由于其在知识获取以及知识表达方面的突出优势而备受青睐。伴随着海量数据的产生,数据中蕴含的不确定知识同时日益增长,因此人们对这些不确定知识给予了越來越多的关注。上世纪60年代中期,扎徳建设性地提出了模糊集合理论,从此人们对模糊知识有了更为精确的表达。同时,众多的学者把模糊集合理论引入了决策树领域,以克服传统决策树存在的尖锐边界问题。ID3算法较早地被模糊化,而最近,SLTQ算法也被引入了模糊环境。本文针对Chandra等人提出的模糊
2、SLIQ算法—G-FDT算法进行讨论,对由该算法归纳出的模糊决策树退化为传统的清晰决策树这一现象,剖析出其中的原因。并根据传统的分裂测试评估函数在模糊环境下表现出的凸性弊端,本文提出了一种新的模糊SLIQ算法——可抗噪的基于属性敏感度的模糊决策树归纳算法,相比于G-FDT,该算法的主要改进有:(1)针对G-FDT算法构造出的候选属性对应得区分函数的形状过于狭窄的问题,本文提出的确定区分函数形状的方法从根本上避免了区分函数近似于清晰区分函数。(2)提出了候选属性敏感度的概念。根据传统节点分裂测试的启发式评估函数在模糊环境下存在的凸性弊端
3、,本文提出了显示候选属性的分类能力的分类敏感度的概念,对于分类敏感度高的候选属性使其对应的区分函数形状性对狭窄,从而使得这种属性倾向于被选择。(3)提出了对训练数据进行异常探测机制。市于G-FDT或早期提出的SG-FDT算法抗干扰能力极差,由其构造出的决策树结构对具体的训练样本较为敏感,削弱了决策树对知识的良好的表达能力。为此,改进后的算法中,当节点进行分裂测试时,对当前的数据进行排噪处理。从而获得决策树相对更加稳定、健壮。(4)提出了使得计算效率提高的优化措施。为了使改进后的归纳算法更加具有实用性,本文提出了多种优化措施来减少由较为
4、复杂的操作而带來的巨大开销,这些措施包括增加节点分裂终止标准、对候选属性进行测试前进行检测以便确定该属性是否被当前节点的祖先节点使用过。本文对可抗噪的基于敏感度的模糊决策树归纳算法进行了相应的实验模拟和结果分析,实验结果表明,该算法真正实现了模糊SLTQ算法,表现出了良好的健壮性,并且有该算法构造出的模糊决策树的分类能力、计算效率方面有了较大的提高。【英文摘要】Decisiontreeisoneofmostwidelyusedtechnologyindataminingdomain,andverypopularwithitspromi
5、nentabi1ityinknowledgeacquisitionandknowledgerepresentation.Withtheproductionofhugeamountsofdata,uncertaintyofknowledgeimbeddedinmassdataisincreasing,sopeoplegivetotheseuncertainknowledgemoreandmoreattention.Inthemid-1960s,Zadeconstructivelyproposedthefuzzysettheory;hen
6、ceforthpeoplehadakindofmorepreciseexpressiontothefuzzyknowledge・Atthesametime,thenumerousscholarshaveintroducedthefuzzysettheoryintothedecisiontreedomain,inordertoovercometheincisiveboundaryproblemthattraditionaldecisiontreeshave・ID3algorithmisfuzzifyedearlier,andrecent
7、ly,SLIQalgorithmhasbeenintroducedintothefuzzyenvironmenI.ThepaperfocusesonthefuzzySLIQalgorithm,G~FDTproposedbyChandra,etal.Forthephenomenonthatthefuzzydecisiontreewhichisinducedbythisalgorithmdegeneratesintotraditionalcrispdecisiontree,thepapergivesconcreteanalysisabou
8、tthereason.Andaccordingtodisplayedunderthefuzzyenvironnientconvexitymalpracticeoftraditionaltestappraisalfunct