欢迎来到天天文库
浏览记录
ID:47872704
大小:202.09 KB
页数:33页
时间:2019-11-14
《毕业设计(论文)-数据挖掘决策树算法的研究与改进(》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、海南师范大学本科生毕业论文(设计)题目:决策树算法的研究与改进姓名:学号:—专业:计算机科淫与技术年级:05专升木系别:计算机科淫与教冇技术完成日期:2007年5月20H指导教师:本科生毕业论文(设计)独创性声明本人声明所呈交的毕业论文(设计)是本人在导师指导下进行的研究工作及取得的研究成果,除了文中特别加以标注和致谢的地方外,本论文中没有抄袭他人研究成果和伪造数据等行为。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。论文(设计)作者签名:—日期:2007年5月21日本科生毕业论文(设计)使用授权声明海南师范大学有权保留并向国家有关部门或机构送交毕业论文(设
2、计)的复印件和磁盘,允许毕业论文(设计)被查阅和借阅。本人授权海南师范大学可以将本毕业论文(设计)的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复印手段保存、汇编毕业论文(设计)。论文(设计)作者签名:指导教师签名:日期:2007年5月21日日期:目录1•引言12•决策树算法的研究22.1.基本定义22.1.1.归纳学习的基木概念22.1.2.信息论的基本概念22.1.3.决策树的基本概念32.2.几种常见的决策树算法的简单介绍42.2.1.ID3算法42.2.2.C4.5算法简介112.2.3.遗传算法GA(GeneticAlgorithm)122.3•决策树的评价标准
3、[1]132.4.决策树的进展与发展方向152.4.1.数据挖掘中决策树算法的主要进展152.4.2.决策树技术面临的挑战及目前研究方向153•关于决策树算法的改进153.1.基于样本离散度[6]的特征选择方法163.1.1.基本概念163.1.2.基于离散度的改进算法173.1.3.分析与比较183.1.4.小结183.2.利用条件概率的思想来改进决策树算法183.2.1.算法的理论基础与基本思想193.2.2.举例分析193.2.3.分析与比较273.2.4.小结274.总结285.结束语286•致谢28参考文献29挖掘决策树算法的研究与改进作者:指导老师:(海南师范大学,海口,571
4、158)摘要:在大量信息展现给人们的时候,“知识爆炸”给人们带来了极大的困扰,如何有效的利用数据成为人们事业成败的关键。本论文主要对决策树的常见算法做初步的研究与探讨,并给出决策树的评价标准。并在此基础上利用最新的决策树算法思想由本人设计实例集验证相关文献中笔者的思想,最后提出自己一点意见和看法。关键词:数据挖掘;决策树;研究;改进TheResearchandImprovementOfDataMiningdecision-makingtreealgorithmAuthor:Tutor:(HainanNormalUniversity,HaiKou,571158)Abstract:Nowada
5、ystherearesomuchinformationlounfoldinthepeoplea(present,whichcausesoureyestakingoutallin,ntheknowledgeexplosion"hasbroughttheenormouspuzzletothepeople,howdoestheeffectiveusedatabecomethepeopleenterprisesuccessorfailurethekey.Thispapermainlydiscussedthepreliminaryresearchandthediscussion(othepolicy
6、-makingtree'scommonalgorithm,andproducesthepolicy-makingtree'sevaluationcriteria,aswellas(opolicy-makingtreefuturediscussion.Usingthenewestpolicy-makingalgorithmthoughtinthisfoundationtodesignintheexamplecollectionconfirmationcorrelationliteratureaftermyselfauthor^thought,finallyproposesaProposehi
7、sviewpointandtheview.Keywords:DataMining;decision-makingtree;Research;Improvement1.引言随着现代信息技术的0速发展,在全球范围内掀起了信息化(Information)浪潮。信息产生的渠道多而且宽广,更新的频率FI益加快,各行业均产生了大量的信息。面对人量多的数据,人们往往无法找到口己所需要的知识或信息,这就是所谓“信息爆炸[3]”(Info
此文档下载收益归作者所有