基于类分度的一种新决策树算法的研究

基于类分度的一种新决策树算法的研究

ID:33909278

大小:1.00 MB

页数:49页

时间:2019-03-01

基于类分度的一种新决策树算法的研究_第1页
基于类分度的一种新决策树算法的研究_第2页
基于类分度的一种新决策树算法的研究_第3页
基于类分度的一种新决策树算法的研究_第4页
基于类分度的一种新决策树算法的研究_第5页
资源描述:

《基于类分度的一种新决策树算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类密级____________硕士学位论文基于类分度的一种新决策树算法的研究焦卫丽导师姓名职称:张明新教授专业名称:计算机应用技术研究方向:数据库技术及应用(数据挖掘)论文答辩日期:2012年5月学位授予日期:2012年6月答辩委员会主席:评阅人:二零一二年五月硕士学位论文M.D.Thesis基于类分度的一种新决策树算法的研究TheResearchonANovelDecisionTreeAlgorithmBasedonTheClassDivisionDegree焦卫丽JiaoWeili西北师范大学硕士学位论文摘要摘要数据挖掘是从大

2、量数据库记录中挖掘出有价值的模式或有规律等知识的复杂过程,已被广泛应用于金融、保险、运输及国防等科学研究领域。其中决策树分类算法是数据挖掘中最为广泛研究和应用的一个课题,是一种有效的数据挖掘分类方法,那么,进一步提出更好的分类算法或改进现有的决策树算法,需要许多研究学者的共同努力。提高决策树的性能,使其更好的适应数据挖掘技术的发展要求,具有重要的理论和实践意义。所以,研究决策树分类算法具有很高的理论意义和应用价值。本文对测试属性选择标准进行了深入的研究,主要包括以下几个方面的内容:首先,通过对文献中提出的类别因子原理的分析和深入的剖

3、析研究,提出了基于类分度的决策树算法。该算法能够很好的构建决策树,不仅执行时间效率好,而且有很好的分类能力。其次,当多个属性的类分度相等的时候,我们该如何选择一个最佳的属性作为当前的节点属性,为了解决这一问题,我们通过实验数据的例证,从实验结果中,得到如何区分属性间分类能力的差异性,提出了优化系数的概念,来修正本文提出的算法,该算法不仅保持了决策树算法的有效性,而且克服在选择测试属性时,存在的多值偏向问题。最后,我们组合优化系数和该算法,形成了最终的决策树算法。通过实验表明了该算法的可行性和优越性,与经典的ID3算法和基于WMR算法

4、相比较,不仅减小决策树的深度,同时也具有很好的执行效率。关键词:数据挖掘;决策树算法;类别因子;优化系数;类分度II西北师范大学硕士学位论文AbstractAbstractDataminingisacomplexprocessthatminesvaluablepatternsorrulesfromalargenumberofdatabasesets,andiswidelyusedinthefieldoffinance,insurance,transportationandnationdefense.Decisiontreealgor

5、ithmisoneofthemostwidelystudiedandappliedsubjects,so,researchesonthedecisiontreealgorithmhavehightheorymeaningandrealisticvalue.Decisiontreealgorithmisanefficientdataminingmethod,then,itrequiresthejointeffortsofmanyresearchersinordertomakethefurtherthebetterclassificat

6、ionalgorithmandimprovetheexistingdecisiontreealgorithm.Toimproveitsperformance,andmakeitsuitablefortherequirementofdataminingtechnology'sdevelopment,hasimportanttheoryandpracticalsignificance.Thispaperdeeplystudiesthetestattributeselectioncriteriaproblemofdecisiontreea

7、lgorithm.Itmainlyincludesthefollowingaspects:Firstly,byanalyzingprincipleofthecategoryfactorwhichisproposedintheliterature.WepresentClassdivisiondegreealgorithm,anewconceptbasedonCategoryfactorthathaveagoodclassificationability.Thealgorithmhasnotonlytheexecutiontimeeff

8、iciency,butalsolowercomplexityandbetterefficiencyintheprocessofconstructingadecisiontree.Secondly,howcanwechooseabett

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。