基于weka的数据分类分析

基于weka的数据分类分析

ID:17729927

大小:339.00 KB

页数:7页

时间:2018-09-05

基于weka的数据分类分析_第1页
基于weka的数据分类分析_第2页
基于weka的数据分类分析_第3页
基于weka的数据分类分析_第4页
基于weka的数据分类分析_第5页
资源描述:

《基于weka的数据分类分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于weka的数据分类分析实验题目基于weka的数据分类分析小组合作否姓名班级12级信管班学号一、实验目的1、使用数据挖掘中的分类算法,对数据集进行分类训练并测试;2、应用不同的分类算法,比较他们之间的不同;3、了解Weka平台的基本功能与使用方法。二.实验环境1、win7+eclipse+weak;2、实验室网络环境三、实验内容与步骤(一)数据准备及预处理1、格式转换方式;(二)三种分类方法分析1、决策树分类;2、K最近邻算法分类;3、朴素贝叶斯分类;4、三类分类方法的校验结果比较;四、实验过程与分析(一)数据准备及预处理1、格式转换方式;原始数据是excel文件保存的xl

2、sx格式数据,需要转换成Weka支持的arff文件格式或csv文件格式。由于Weka对arff格式的支持更好,这里我们选择arff格式作为分类器原始数据的保存格式。转换方法:在excel中打开“weather.xlsx”,选择菜单文件->另存为,在弹出的对话框中,文件名输入“weather”,保存类型选择“CSV(逗号分隔)”,保存,我们便可得到“weather.csv”文件;然后,打开Weka的Exporler,点击Openfile按钮,打开刚才得到的“weather”文件,点击“save”按钮,在弹出的对话框中,文件名输入“weather”,文件类型选择“Arffdata

3、files(*.arff)”,这样得到的数据文件为“weather.arff”。(二)三种分类方法分析1、决策树分类:用“Explorer”打开刚才得到的“train-data.arff”,并切换到“Class”。点“Choose”按钮选择“tree(weka.classifiers.trees.j48)”,这是WEKA中实现的决策树算法。选择Cross-Validatioinfolds=10,然后点击“start”按钮:1、K最近邻算法分类:点“Choose”按钮选择“laze->ibk”,这是WEKA中实现的决策树算法。选择Cross-Validatioinfolds=1

4、0,然后点击“start”按钮:1、朴素贝叶斯分类;点“Choose”按钮选择“bayes”,这是WEKA中实现的决策树算法。选择Cross-Validatioinfolds=10,然后点击“start”按钮:1、三类分类方法的校验结果比较;据上述数据,虽然朴素贝叶斯分类算法有最高的准确率,而标准误差较高;而决策树的准确率相对较高而标准误差也较高,综合评价可以得知,当前最好的分类算法是KNN算法。五、实验总结通过本次实验,使我对Weka平台有了比较完整和深入的认识,对Weka中进行分类分析的KNN算法、素贝叶斯算法和决策树算法都有了进一步的理解。通过实验,对数据挖掘本身也有了

5、比较直观的认识,同时也深刻体会到数据预处理对于数据挖掘的重要性。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。