决策树算法在Weka平台上的数据挖掘应用

决策树算法在Weka平台上的数据挖掘应用

ID:39581489

大小:722.58 KB

页数:4页

时间:2019-07-06

决策树算法在Weka平台上的数据挖掘应用_第1页
决策树算法在Weka平台上的数据挖掘应用_第2页
决策树算法在Weka平台上的数据挖掘应用_第3页
决策树算法在Weka平台上的数据挖掘应用_第4页
资源描述:

《决策树算法在Weka平台上的数据挖掘应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、万方数据MicrocomputerAppIicationsV01.31,No.06,2015技术交流微型电脑应用2015年第31卷第06期文章编号:1007—757X(2015)06—0063—03决策树算法在Weka平台上的数据挖掘应用程斐斐,王子牛,侯立铎摘要:决策树算法可以对数据集进行有效的训练学习和快速准确的分类,其中ID3算法是最早提出的一种决策树算法,但是,此算法只适用于处理取值较多属性的数据,不能处理连续数据,对噪声也比较敏感。C4.5算法是对ID3算法的优化,不仅可以对连续值属性进行处理,而且增加了对空值数据的处理

2、功能。在研究和分析主流决策树算法基础上,针对二手汽车数据库在Weka数据挖掘平台进行了C4.5算法的设计与实现。实验结果表明该算法对预测数据集中的相应属性能进行较为准确的预测。关键词:决策树算法;ID3;C4.5;Weka中图分类号:TP302文献标志码:ADataMiningApplicationinWekaPlatformBasedonDecisionTreeClassificationChengFeifei,WangZiniu,HOULiduo(CollegeofBigDataandInformationEngineerin

3、g,GuizhouUniversity,Guiyang550025,China)Abstract:Decisiontreealgorithmcandoeffectivetrainingandlearningaswellasfastaccurateclassificationtodataset.ID3algorithmiStheearliestdecisiontreealgorithm.Butthisalgorithmcanonlybeappliedtohandlemoreattributedatavalues,andcontinu

4、ousdatacan’tbesolvede街ciently.ItiSalsosensitivetonoise.C4.5algorithmiStheoptimizationofID3algorithm.Itcannotonlysolvethecontinuousattributevalues.butalsoincreasethefunctionofemptydata.ThispapermainlyusesWekadataminingtoolstodothedesignandrealizationofC4。5algorithm。whi

5、chjSbasedonanexampleofSecond—handcardatabase.111isexperimentindicatesthatthoseconcentratedvaluescanbepredictedaccuratelybythisalgorithm.Keywords:DecisionTreeAlgorithm;ID3:C4.5:Weka0引言随着计算机和信息时代的发展,人们收集、存储和访问的数据急剧增加,如何从大量的数据中提取并发现有用信息或知识,引起了学术界的广泛关注。数据挖掘因此应运而生。数据挖掘的方法有

6、很多,包括分类、预测、聚类、关联规则挖掘、序列模式挖掘等。其中分类问题是被广泛研究的课题之一,它是用来分析数据库中的一组对象,找出共同的属性,构造分类模型,然后利用这个模型对其它的数据对象进行分类。广泛使用的分类方法有决策树、贝叶斯分类、遗传算法和神经网络等。其中,决策树是一种常用于预测模型的算法,它将大量数据有目的的进行分类,从中找到一些具有商业价值的、潜在的信息。1决策树介绍1.1决策树技术决策树是用于分类与预测的主要技术,它是以实例为基础的归纳学习算法,通过一组无次序、无规则的事例中推理出决策树表现形式的分类规则。这种算法采

7、用“自顶向下、分而治之”的方法,通常用来形成分类器和预测模型,可以对未知数据进行分类、预测和数据预处理等。决策树是一个类似于流程图的树结构,每个分枝代表一个测试输出,树叶代表类或类分布,树的最顶层结点是根结点。在决策树的基本结构图中,中间结点常用矩形表示,叶子结点代表目标类别属性的值,用椭圆形表示。是一棵简单的决策树,如图1所示:AaI/——\、a2------●:---------一Bbl,/

8、b2,。t,‘—、/’一、71f21、,、\—/v图1决策树结构图1.2决策树的主要步骤决策树构造可以分两步进行:第一步,建树阶段:由训

9、练数据集生成决策树的过程。按递归算法构造决策树,直到每个叶子结点属于同一类为止,其本质是贪心算法。第二步,剪枝阶段:它是用数据对生成的决策树进行检验,将不正确的问题进行调整,对决策树进行剪枝和增加结点,直到建立~个正确的决策树。剪枝的主要目的是去掉

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。