欢迎来到天天文库
浏览记录
ID:58536054
大小:132.00 KB
页数:6页
时间:2020-09-03
《数据挖掘实验指导.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、实验3分类分析一、实验目的(1)学习决策树分类学习方法,学习其中C4.5学习算法,了解其他Id3、C5.0等其它分类学习方法。(2)应用Weka软件和Clementine软件,学会导入数据文件,并对数据文件进行分类分析。(3)学会如何选择学习函数并调节学习训练参数以达到最佳学习效果。(4)学习并应用其他决策树学习算法,可以进行各种算法对照比较。二、实验内容1、相关知识决策树是利用一系列规则构建一棵树.它可高度自动化地建立起易于为用户所理解的模型并且具有较好地处理缺省数据及带有噪声数据等能力。可以直观、清晰地表达加工的逻辑要求。特别适合于判断因
2、素比较少、逻辑组合关系不复杂的情况。数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。 决策树分类算法有CLS,ID3,C4.5,CART等算法。这里采用C4.5算法和C5.0算法。WEKA里的J48决策树模型是对Quinlan的C4.5决策树算法的实现,并加入了比较好的剪枝过程,有非常好的精度。2、weka软件练习(1)用J48算法对“weather.arff”(C:ProgramFilesWeka-3-7data)作分类分析。(2)选择其他数据进行决策树分类学习(bank-data-final.arf
3、f),学习并应用其他决策树学习算法(如Id3算法),可以进行各种算法对照比较。3、Clementine软件练习用C5.0算法对bank-data.csv作分类分析。三、实验操作1、weka软件练习(1)在开始程序(或者桌面图标)中找到WEKA,单击即可启动WEKA,启动WEKA时会发现首先出现的一个命令提示符。接着将出现如下WekaGUIChooser界面。(2)选择GUIChooser中的探索者(Explorer)用户界面。点击预处理(Preprocess)功能按钮的,Openfile,选择其中的“weather”数据作关联规则的分析。打开
4、“weather.arff”,可以看到“Currentrelation”、“Attributes”“Selectedattribute”三个区域。(3)点击“Classify”选项卡。单击左上方的Choose按钮,在随后打开的层级式菜单中的tree部分找到J48。(4)选中J48分类器后,J48以及它的相关默认参数值出现在Choose按钮旁边的条形框中。单击这个条形框会打开J48分类器的对象编辑器,编辑器会显示J48的各个参数的含义。根据实际情况选择适当的参数,探索者通常会合理地设定这些参数的默认值(如minnumobj:叶子节点最小实例数目
5、)。(5)选定分类器后,单击Start按钮使其开始工作。Weka每次运行时间的较短。在它工作时,坐在右下角的小鸟会即时起舞,随后结果就显示在右区域中。(6)实验结果在窗口的右区域默认显示了全部输出结果。在该结果的开头给出了数据集概要并注明所需要的评估方法是默认的10折交叉验证。可以选择其他的验证方法来重新分类学习。2、Clementine软件练习(1)在开始程序(或者桌面图标)中找到Clementine,单击启动Clementine。(2)在“源”选项卡中选择“可变文件”,右键单击选择“编辑”。在“文件”选项卡中导入数据文件(bank-dat
6、a.csv),在“类型”选项卡中,单击“读取值”按钮,“pep”字段(类别字段)输入方向选择为“输出”。(3)在“建模”选项卡中选择“C5.0”,单击“运行”按钮。在输出的“模型”和“查看器”选项卡中查看分类结果。四、实验结果
此文档下载收益归作者所有