决策树id3分类算法研究

决策树id3分类算法研究

ID:34132239

大小:2.01 MB

页数:63页

时间:2019-03-03

决策树id3分类算法研究_第1页
决策树id3分类算法研究_第2页
决策树id3分类算法研究_第3页
决策树id3分类算法研究_第4页
决策树id3分类算法研究_第5页
资源描述:

《决策树id3分类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浙江工业大学硕士学位论文决策树ID3分类算法研究作者姓名:指导教师:章晓何熊熊教授浙江工业大学信息工程学院2014年4月DissertationSubmittedtoZhejiangUniversityofTechnologyfortheDegreeofMasterResearchontheID3AlgorithmsofDecisionTreeCandidate:ZhangXiaoAdvisor:Prof.HeXiongxiongCollegeofInformationEngineeringZhejiangUniversityofTechnologyApr.2014浙江工业大

2、学学位论文原创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均己在文中以明确方式标明。本人承担本声明的法律责任。作者签名:绰嘲日期:聊年上月力6日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部

3、或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密口,在年解密后适用本授权书。2、不保密饧。(请在以上相应方框内打“寸’)作者签名:牵闩蛆导师签名:彳可饿锹日期:加倍年乡月2占日日期:砰年●月JoEt浙江工业大学硕士学位论文决策树ID3分类算法研究摘要数据挖掘技术能够从海量数据中挖掘有价值的信息,是处理大数据最有效的技术方法之一。分类是数据挖掘中最重要的内容之一,分类技术被广泛应用在科研和智能商业活动中。决策树方法又是分类技术最重要的方法之一。经过将近50年的研究发展,已经出现了多种先进的决策树分类算法。其中,ID

4、3(IterativeDichotomize)算法是最著名的决策树算法,也是其他多数决策树算法的研究基础。因为理论清晰,方法简单,容易实现,易于理解,且分类效果较好,ID3算法被学者们广泛研究。然而ID3算法也有显著的缺点:如选择分裂属性时,倾向于选择那些有较多属性值的属性;决策树在构建过程中,没有对树进行优化:ID3算法的表达式逻辑性有待加强等。对ID3算法的研究,本文主要做了如下工作:1、从理论上讨论分析了ID3算法多值偏向的原因。在理论分析过程中,主要做了以下两方面的尝试创新:(1)基于粗糙集理论创造性引入属性重要度概念。(2)分析了属性在增加属性值时对其他属性的属性重

5、要度的影响。2、提出了改进的决策树算法一一SⅢ3算法。针对ID3算法的一些不足,SID3算法引入与属性值个数相关函数,简化ID3算法表达式,增加前剪枝技术。经过实验验证,SID3算法克服了ID3算法在属性选择时的偏向多值属性缺点,减少了计算量,增强了算法的逻辑性,增加剪枝技术,优化决策树。综合来讲,SID3算法在构建决策树时效率更高、构建的决策树的形状结构更加合理及判别精确率更加高。3、最后基于visualStudio平台,用Csharp编程语言软件实现基于ID3及SID3算法的决策树智能系统,并应用在数字医疗诊断方面。关键词:数据挖掘,决策树,ID3算法,多值偏向,SID3

6、算法,医疗诊断浙江工业大学硕士学位论文RESEARCHONTHEID3ALGORITHMSoFDECISIONTREEABSTRACTAsoneofthemosteffectivemethodsfordealingwithbigdata,dataminingtechnologycanobtainvaluableinformationfrommassivedata.Beingoneofthemostimportantsubjectsofdatamining,classificationtechniqueiswidelyusedinscientificresearchandbus

7、inessintelligenceactivities.Furthermore,decisiontreetechniqueiSoneofthemostimportantmethodsofclassificationtechniques.Duringthepast50years,manyintelligentdecisiontreeconstructionalgorithmshavebeenproposed.TheID3(IterativeDichotomize)algorithmisoneofthemo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。