基于决策树c.算法的数据挖掘技术研究论文

基于决策树c.算法的数据挖掘技术研究论文

ID:12169813

大小:171.50 KB

页数:21页

时间:2018-07-16

基于决策树c.算法的数据挖掘技术研究论文_第1页
基于决策树c.算法的数据挖掘技术研究论文_第2页
基于决策树c.算法的数据挖掘技术研究论文_第3页
基于决策树c.算法的数据挖掘技术研究论文_第4页
基于决策树c.算法的数据挖掘技术研究论文_第5页
资源描述:

《基于决策树c.算法的数据挖掘技术研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于决策树C4.5算法的数据挖掘技术研究摘要:在过去的数十年中,我们产生和收集数据的能力已经迅速提高,存贮数据的爆炸性增长已激发对新技术和自动工具的需求,以便帮助我们将海量数据转换成信息和知识。以下介绍了数据挖掘技术的发展概况,及相关数据挖掘技术分类器,及同时利用9个学习样本数据做为基础,并采用数据挖掘中的决策树算法C4.5技术就如何实现生成一棵树的相关知识进行了研究,特别说明了生成一个树的基础分析,给出了实际应用例子。结果表明,由决策树算法C4.5技术能够很好的实现数据挖掘功能。关键词:数据挖掘,知识发现,决策树算法,分类器

2、,C4.5算法,生成树。ResearchonthetechnicalresearchaccordingtothedecisiontreecalculatewayC4.5data【Abstract】:Inpastfewdecades,weproducetohasalreadyraisedquicklywiththeabilityofthecollectionsdata,theexplosiongrowththatsavethedataof贮hasalreadystireduptheneedtonewlythetechniquea

3、ndautomatictool,inordertohelpwebecometheamountofseadataconversioninformationandknowledge.Introducedthedatatoscoopoutthetechnicaldevelopmentgeneralsituationasfollows,andtherelateddatascoopoutthetechniqueclassificationmachine,andmakeuseof9studiessampledatatobeusedasth

4、efoundationatthesametime,andtheadoptiondatascoopoutthemediumdecisiontreecalculatewayC4.5techniquehowcarriedouttherelatedknowledgeofatreetocarryontheresearch,speciallyexplainedthefoundationofborntreeanalysis,giveactualappliedexample.Asaresultexpressthatbecanbegoodbyt

5、hedecisiontreecalculatewayC4.5techniquetocarryutthedataexcavationfunction.resultexpressthatbecanbegoodbythedecisiontreecalculatewayC4.5techniquetocarryoutthedataexcavationfunction.【Keyword】:Thedatascoopout,knowledgedetection,thedecisiontreecalculateway,theclassifica

6、tionmachine,calculatewayofC4.5第一章数据挖掘导论1.1引言:1.1.1课题概述1.随着数据库技术的飞速发展以及人们获取数据手段的多样化,人类所拥有的数据信息急剧增加。从数据管理角度来看,历史数据是一笔宝贵的财富,而且这些数据的正以几何级数或指数增长。目前能够将这些数据进行其利用并分析处理的工具却很少。现数据库系统所能做到的只是对数据库中已有的数据进行存取和简单操作,人们通过这些数据库数据所获得的信息量仅仅是整个数据库所包含的信息量的很少一部分,隐藏在这些数据之后的更重要的是关于这些数据整体特征的描

7、述及对其发展趋势的预测。新兴的数据挖掘技术却能够为决策者提供重要的,极有价值的信息或知识,并能产生不可估量的效益。2.在数据挖掘领域,现代科学和工程建立在用“首要原则模型(first-principlenodes)”来描述物理、生物和社会系统的基础上。这种方法从基础的科学模型入手,如牛顿运动定律或麦克斯韦的电磁公式,然后基于模型来建立机械工程或电子工程方面的各种运用,用实验数据来验证基本的“首要原则模型”,以及对一些难以直接测量或者根本不可能直接测量的参数进行评估。但是在许多领域,基本的“首要原则模型”往往是未知的,或者研究的

8、系统太复杂而难以进行数学定型,随着计算机的广泛应用,像这样的复杂系统产生了大量的数据,对大型的、复杂的、信息丰富的数据集的理解实际上是所有的商业,科学工程领域的共同需要,吸取隐藏在这些数据后面的有用知识变的越来越重要。运用基于计算机的方法,包括新技术,从而在数据中获得有用知识

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。