欢迎来到天天文库
浏览记录
ID:45580987
大小:217.14 KB
页数:12页
时间:2019-11-15
《决策树分析-蒲骏逸》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、管理与决策支持系统系列作业决策树专业:05信息管理与信息系统姓名:蒲骏逸学号:200530341432题目要求:借助数据挖掘软件Clementine进行地下燃气管网安全评价的分析与评价。已知:八个影响因素、107条评价记录决策树分析作业:对107个样本进行安全级别的样本进行决策树分析,把聚类得到的20个样木作检验样木,表出决策树的推理结果和推理正确率。内容:1)对107个样本建立决策树2)对20个聚类得到的样本建立决策树3)使用CART方法建立决策树一,对107个样本建立决策树:我们将对107个地下然气管网样本进行决策树分析,接入了数据源Z后,由于八个指标中,“运行时间”和“防腐层种类”只
2、有一个值,所以直接过滤掉,剩下六个指标,接入类型节点,并设为输入方向。因为决策树是一个机器学习的过程,需要有输出,所以把“专家评价级别”设为输出。要注意的是,需要把“专家评估级别”的类型设为“集合”。字段l类型缺失方向<#>雙邃时间®运行时间厚帛嬴壤眾极壁漏防土专阳・rL、>_3续续SS建建合续连连连连连连集连[1.0.1.0][0.0,0.5][0.5.1.0][0.0.1.0][0.0,1.0][0.0,1.0]1.0,2.0(3....[0.0.1.0]无无无无无无无无入入入入入出入无输输输输输输输然后接入决策树模型节点,首先都是用默认的设置,然我们看看结果壁厚<=0.500[众数:
3、3]I}…土壤腐蚀性<=0.500[众数4]U>4.0I?…土壤腐蚀性>0.500[众数:3]03.0i…壁®>0.500[众数:2]o2.0可以看到,在默认的模型设置下,生成的决策树比较简单,只有两层,它首先按壁候来分类,然后就是土壤腐蚀性,但是,决策树虽然简单,但判别的效果似乎不太好,例如节点二,有85.714%判为4,而其他14.286%本来为3的都被判为4了,这都判错了。从决策树的节点信息,大概可以估计次决策树的自检正确率只有85%左右,现在让我们来看看Clementine给出的正确率:正确9285.98%诸误1514.02%总计107自••比较$c■专凉评估级别与专家评估级别正确
4、1575%错误525%总计20白比较$c・专家评估级别与专家评估级别正如估计那样,此模型下的决策树,对107个样本的自检正确率为85.98%,而对20个聚类样木检验的正确率为75%,虽然不算十分高,但考虑到决策树只有两层,深度只有3,所以效果还是勉强令人满意的。接下来,我们尝试提高这个决策树的正确率,在这里,我在建模时,增加了“误使用实际于预测值差距的绝对值作为错判成本,体现了判断的差距越大,成本越大的原则。增加了这个考虑后,我们再来建立模型,看看结果:午夜醒来<=0.500类别%n■1.0000.0000■2.0007.3176■3.00054.87845■4.00037.80531总计
5、76.63682I曰节点1土壤腐蚀性节点6类别%n■1.00012.0003■2.00088.00022■3.0000.0000■4.0000.0000总计23.36425>0.500$c・专家评估级别节点0类别%n■1.0002.8043■2.00026.16828■3.00042.05645■4.00028.97231总计100.000107r「……韵壁厚i增加了对误判成本的考虑后,决策树多了一层,预计其正确率应该会有所提升白••比较$c・专凉评估级别与专家评估级别白••比较专家评估级别与专家评估级别正确9487.85%诸误1312.15%总计107正确1680%错误420%总计20止
6、如预料的那样,随着决策树的层数增多,深度增加到9,其无论是口检还是对20个检验样木的正确率都有所提升。但是,如果要再提高正确率的话,我们需要更改模型的一些设定,但别是,对于剪枝的设定,通常,剪枝会是决策树简化,但却会降低正确率。模式:o简单@专家修劈严重性:0■▼毎个子分支的杲小记录数:1A▼这里,修建严重性改为0,即是不进行剪枝。曰…壁厚v0.500[众数:3]I白“土壤腐蚀性<=0.500[众数:4]J••“运行时间<=0[众数:3]t=>3.0:“运行时间>0[众数4]4.0
7、$…土壤腐蚀性>0.500[众数「3]U>3.0?••“壁厚nH50CI[众数:2]2.0从这个结果,可以看
8、到,不进行修剪,不考虑误判,其生成的决策树,实际是和Z前默认设置并考虑误判成本后的决策树是一样的。这样的,很自然,使人想到,如果减低修剪的同时,增加考虑谋判成本,是否能有效提高正确性呢?然我们来看看,同样修剪程度为0,并考虑Z前的误判成本矩阵,得出的结果:0-壁厚<=0.500[众数:3]I亠土壤腐蚀性<=0.500【众数:4]
9、白“运行时间<=0[众数:3]
10、j…漏点线密度个10米<=0[众数4]r=>4.0
11、:…漏点
此文档下载收益归作者所有