实验3-------决策树

实验3-------决策树

ID:45794527

大小:187.26 KB

页数:12页

时间:2019-11-17

实验3-------决策树_第1页
实验3-------决策树_第2页
实验3-------决策树_第3页
实验3-------决策树_第4页
实验3-------决策树_第5页
资源描述:

《实验3-------决策树》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、clementine决策树分类模型一.基于决策树模型进行分类的基本原理概念分类就是:分析输入数据,通过在训练集中的数据表现出来的特性,为每一个类找到一种准确的描述或者模型。由此生成的类描述用来对未来的测试数据进行分类。数据分类是一个两步过程:第一步,建立一个模型,描述预定的数据类集或概念集;第二步,使用模型进行分类。clementine8.1中提供的回归方法有两种:C5.0(C5.0决策树)和NeuralNet(神经网络)。下面的例子主要基于C5.0决策树生成算法进行分类。C5.0算法最早(20世纪50年代)的算法是亨特CLS(C

2、onceptLearningSystem)提出,后经发展由JRQuinlan在1979年提出了著名的1D3算法,主要针对离散型属性数据;C4.5是ID3后来的改进算法,它在ID3基础上增加了:对连续属性的离散化;C5.0是C4.5应用于大数据集上的分类算法,主要在执行效率和内存使用方面进行了改进。优点:在面对数据遗漏和输入字段很多的问题时非常稳健;通常不需要很长的训练次数进行估计;比一些其他类型的模型易于理解,模型推出的规则有非常直观的解释;也提供强大的增强技术以提高分类的粘度。二.范例说明该范例的背景是客户详细的个人投资计划作为

3、一种市场营销活动的结果,snapshottrainN.db(训练数据)描述的是不同age(年龄),不同sex(性别),不同region(地域),不同income(收入),不同married(婚姻),等等的数据,通过分类算法対训练数据进行建模得到决策树模型,通过得到的决策树模型來判断测试数据集(snapshottestN.db)里面的每个记录的pep(个人投资计划)属性是yes还是no。使用clementine建立流程图,如图1所示:[■IvTablesnapshottrainN.dbpep-囤pepAnatysis[■]YTabl

4、eType图1总流程图pepsnapshottestN.db—囤Analysis一.数据集说明数据集snapshottrainN.db,以下是该数据集的所有字段名:•id.唯一的识别号•age.年龄•sex.性别•region.地理位置•income.收入•menied.是否已婚•children.有几个孩子•car.是否有汽车•save_act.是否有储蓄账户•current_act.是否有活期存款•mortgage.是否有抵押•pep.是否有个人投资计划训练模型通过卜•面的操作,将完成如图2所示的流。nA⑥pepAnalysi

5、s图2训练模型(1)导入数据及预处理插入一个变项文件节点(Source'Va匚File),双击该节点,在File框输入snapshottrainN.db的物理路径,如图3所示:♦Var.File区/^I2Refresh⑥E:lSpssClementine^i3gsnapshottrainN.dbFile:EASpssClementine^据IsnapshottrainN.db口(B)Var.File"id;agez?'sex?»?region#"income'.»married'»'children‘'car'?'save_a

6、cC»'current_a<'ID1210V.4®'FEMALE','INNER-CITY',17546.0/N01//N0'N0"1TO?/YES''ID12102',40,'MALE'??TOWlf,30085.1,»YES',3/YES?/N0?,'YES','YES'/NO,'ID1210T,51,'FEMALE','IHNER_CI1T,16575.4,'YES',0/YES?/YES'/YES'/N0#N0^图3输入节点(1)变量类型的定义及实例化:在建模之前,我们首先将一个类型节点TypeNode加到目前的流

7、程中。点击ReadValues以读取数据。因为需要用年龄,性别,地区,收入等等为引数来估计个人投资计划,所以将id的Direction设为“None”,将pep设为“Out”,其他字段设为“In”。如图4所示:-0>Type•Type®lFieldsTypeValuesMissingCheckDirection1a]idTypelessNone0Nonepage/Range[18.67]Noneln[AsexwFlagMALE/FE...None[Aregion*SetINNER.C…None、ln笏income®Range[5

8、014.21....None[A]marriedFlagYES/NONone、lnchildren夕Range[0.3]Noneln向carsFlagYES/NONone、l门Asaveact3®FlagYES/NONoneAcurrenLact

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。