欢迎来到天天文库
浏览记录
ID:54589629
大小:273.05 KB
页数:5页
时间:2020-05-02
《叶枝分辨的决策树研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2013年9月计算机工程与设计Sept.2013第34卷第9期COMPUTERENGINEERINGANDDESIGNVo1.34No.9叶枝分辨的决策树研究刘军(南京工业大学电子与信息工程学院,江苏南京210009)摘要:为了解决当前构建决策树算法中准确度与计算量之间的矛盾,根据粒计算理论,提出了利用叶枝粒之比的决策树构建算法:将条件属性按属性值划分为若干基本粒作为基本分配单位(叶重量),而将基本粒所对应的决策属性值的类别数量作为基本接受单位(枝数量),直接利用叶枝粒比判断确定划分属性,由所选划分属性自顶向下构造决策树。通过理论与实例分析结果表明了该算法简洁且准确性高。关键词:
2、粗糙集;决策树;粒分辨关系;叶枝粒比;划分属性中图法分类号:TP18文献标识号:A文章编号:1000—7024(2013)09—3245—05ResearchondecisiontreebasedonthedistinguishmentofleavesandbranchesLIUJun(CollegeofElectronicsandInformationEngineering,NanjingUniversityofTechnology,Nanjing210009,China)Abstract:Tosolvethecontradictionsbetweenaccuracyandco
3、mputationinthecurrentconstructionofdecisiontreealgorithm,adecisiontreeconstructionalgorithmisproposedbasedonthegrainratiooftheleavesandbranchesaccordingtothegraincompu—tingtheor~Theconditionattributebythevaluesaredividedintoanumberofbasicgrainsastheallocationunit(1eafweight),andthenumberofthe
4、segrainscorrespondingtotheclassesofthedecisionattributesareasthebasicacceptedunit(thequantityofbranches),thepartitionattributeisdirectlydeterminedbythegrainratiooftheleavesandbranchesandthedecisiontreeisbuiltwiththeselectedattributefromtoptodown.Throughtheoreticalandexperimentanalysis,thisalg
5、orithmisconciseandac—curate.Keywords:roughset;decisiontreedefiniterelationofgrand.ion;thegrainratiooftheleavesandbranches;partitionattribute数称为枝,用这两个参数测定该条件属性粒的分辨力。条0引言件属性的分辨力则由其各基本粒分辨力之和所决定,分辨当前基于单划分属性建立决策树算法主要存在以下问力最高者为划分属性。由于粒计算的简洁性,对分辨力相题:基于信息增益的算法是一种局部优化策略l】],当属性近属性可以再计算比较其后续层的分辨力,最终得到最佳
6、集中多个属性的信息增益相近时难以准确地确定出划分属划分属性,这是一种全局判优的算法。另外,采用数据库性,且指数运算复杂度高;基于粗糙集l_3]的决策树生成算SQL语言查询可以降低计算复杂度。由大量实例比较分析法要经过属性约简和确定划分属性两个步骤l_4],属性约简可知,该算法计算量较小且准确度较高。存在多选性及难以准确保留有效属性的问题l6],而且单以1理论及实现核属性强度确定划分属性并不能获得最佳效果,因为决策树优化是个全局问题,当前属性集中分辨最强的单个属性1.1理论可能只是本集局部最优而非全局最优。如果要达到全局最决策表[]S一(U,{An},D,V),{An}为条件属性优
7、需要进行大量的预测计算,显然上述算法难以实现。为集,D为决策属性,U一{x1,】(2,⋯,xn'l}是论域,V是此提出了一种基于粒计算[7]的精准建树算法,该算法不仅属性值集。考虑当前层中属性的分辨能力,而且预测其后续层中的分定义1条件属性Ai中各取值相同部分为一个基本辨趋势。根据粒计算l_7]理论,将每个属性按属性值划分为粒[],记为(Ai,v),{(Ai,v)lAi∈{An},v∈V))。叶(基本粒),每个条件属性叶对应的决策属性叶的种类个基本粒中相同值的记录数量称为粒值量(
此文档下载收益归作者所有